Google hat einen weiteren Hit gelandet: Wie Gemini 2.5 Pro Experimental die Grenzen der KI-Produktivitätswerkzeuge neu definiert

I. Einleitung

Peking, 26. März, Googles neu auf den Markt gebrachtes Gemini 2.5 Pro Experimental wurde soeben als das bisher fortschrittlichste KI-Modell gepriesen. Als erstes Mitglied der mit Spannung erwarteten "Thinking Models"-Serie von Google bietet es ein Kontextfenster von bis zu einer Million Token und eine Reihe von beeindruckenden Leistungsverbesserungen. Das bedeutet, dass es in der Lage ist, das Äquivalent von zwei Büchern des Traums von der Roten Kammer auf einmal zu verarbeiten.

Im "Last Human Exam"-Test erreichte es die höchste Punktzahl von 18,81 TP3T, was bei weitem die beste Punktzahl aller unbenutzten (extern erstellten) großen Modelle ist. Der "Last Human Exam" ist ein multimodaler Benchmark-Test, der von fast 1.000 Experten aus aller Welt entwickelt wurde, um die Grenzen der Fähigkeiten großer Sprachmodelle zu ermitteln. Der Test besteht aus 3.000 hochmodernen Fragen, die ein breites Spektrum von Bereichen abdecken, darunter Mathematik, Geistes- und Naturwissenschaften.

Der Gemini 2.5 Pro gewann auch den Test in der Big Model Arena mit einem Rekordvorsprung. Er machte den größten Punktesprung in der Geschichte und übertraf den Grok-3 und den GPT-4.5 um mehr als 40 Punkte.

 

Jeff Dean, Chief Scientist bei Google Deepmind, schrieb in einem Blogbeitrag: "Unser Gemini 2.5 Pro Modell ist eine deutliche Verbesserung gegenüber der Gemini 2.0 Serie. Es ist großartig zu sehen, dass es die LiveBench-Charts mit beträchtlichem Vorsprung anführt."

Zweitens, welche Aspekte des vorteilhaften Gemini 2.5 Pro Experimental bringen einen Sprung nach vorne?

1. die Reasoning Power Pro Max Edition

Auf der offiziellen Website von Google heißt es, dass Gemini 2.5 Pro in einer Reihe von Benchmarks, die fortgeschrittenes logisches Denken erfordern, führend ist. Ohne kostenverursachende Prüfungstechniken wie Mehrheitsentscheidungen führt der 2.5 Pro bei mathematischen und naturwissenschaftlichen Benchmarks wie GPQA und AIME 2025.

Zum Beispiel können wir eine Ableitung der QED mit Textaufforderungen und detaillierten Lernnotizen erstellen:

Ein anderes Beispiel ist, wenn Sie faul sein wollen und sich von 2.5 Pro helfen lassen, Ihre Arbeit mit weniger Aufwand zu schreiben:
@Dr.Novo:Gemini 2.5 pro hat mir gerade geholfen, meine 15-seitige Forschungsarbeit über "Hybrid Models for Understanding Continuous to Discrete Neural Transformations" in LaTex wortwörtlich zu beenden! Das hat mir Stunden an Schweiß erspart!Ich habe alle anderen Modelle ausprobiert und sie sind alle bei 20% Missionsfortschritt gescheitert ......

2. die Kodierkapazität der Pro Max Version

Offiziell sagt Google, dass Gemini 2.5 Pro Experimental einen großen Sprung nach vorne von der Version 2.0 macht, mit weiteren Verbesserungen in der Zukunft. 2.5 Pro zeichnet sich durch die Erstellung von visuell ansprechenden Web-Apps und Agentencode-Apps aus, sowie durch Code-Transformation und -Bearbeitung. Im SWE-Bench Verified, dem Industriestandard für Proxy-Code-Evaluierung, erzielte Gemini 2.5 Pro 63,8% mit benutzerdefinierten Proxy-Einstellungen.

Insbesondere ist 2.5 Pro in der Lage, seine Denkfähigkeiten zu nutzen, um Videospiele zu erstellen, indem es ausführbaren Code aus einer einzeiligen Eingabeaufforderung erzeugt.

Jeff Dean hat auf Twitter auch den Code gepostet, den das Gemini 2.5 Pro Modell mit der Eingabeaufforderung "p5js exploring the Mandelbrot set" geschrieben hat:

III. 2.5 Pro One-Click Benutzerhandbuch

Insgesamt erfasst 2.5 Pro explizite Befehle und führt sie präzise aus, mit der Fähigkeit, komplette Website-Architekturen zu erstellen.

Um 2.5 Pro einfach und effizient zu nutzen, können Sie direkt die folgenden drei Wege beschreiten:

1, Google Official:http://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-pro-exp-03-25

2. das Hemd AI:https://www.myshirtai.com/signup

3) API-Aufruf:https://api.mygptmeta.com/

Zufälligerweise wurden Deepseek v3.1 und 2.5 Pro im Abstand von fast nur 30 Stunden veröffentlicht. Viele Netizens haben Vergleiche angestellt:

Außerdem baten wir beide Modelle, "ein HTML-Skript zu schreiben, das einen Ball darstellt, der in einem rotierenden 4D-Tesserakt hüpft. Wenn der Ball eine Seite berührt, hebe diese Seite hervor". Was die tatsächliche Darstellung betrifft, so haben beide Modelle ihre eigenen Merkmale, und beide sind in der Lage, die Anweisungen des Benutzers genau zu erfüllen. Im Vergleich dazu ist der 2.5 Pro jedoch minimalistischer gestaltet und besser zu erkennen.
Verschiedene Arbeits- und Lernszenarien haben unterschiedliche Anforderungen, und wir können das am besten geeignete Modell je nach den Einzelheiten auswählen, um die Produktivität zu verbessern.

Wenn Sie Gemini 2.5 Pro, GPT Plus, Claude Pro, Grok Super als offizielles, bezahltes Exklusivkonto nutzen möchten, können Sie unser professionelles Team kontaktieren, wenn Sie nicht wissen, wie Sie Ihr Konto aufladen können (wx: f15303420735).

Weitere Produkte finden Sie unter

Siehe mehr unter

ShirtAI - Durchdringende Intelligenz Das AIGC Big Model: der Beginn einer Ära der doppelten Revolution in Technik und Wissenschaft - Penetrating Intelligence
1:1 Wiederherstellung von Claude und GPT Offizielle Website - AI Cloud Native Live Match App Global HD Sports Viewing Player (empfohlen) - Blueshirt Technology
Transitdienst auf der Grundlage der offiziellen API - GPTMeta API Hilfe, kann jemand von Ihnen Tipps geben, wie man Fragen auf GPT stellt? - Wissen
Global Virtual Goods Digital Store - Global SmarTone (Feng Ling Ge) Wie leistungsfähig ist Claude airtfacts, dass GPT sofort nicht mehr gut riecht? -BeepBeep