グーグルがまたヒット作を手に入れた:Gemini 2.5 Pro ExperimentalがAI生産性ツールの境界を再定義する方法

I. はじめに

北京、3月26日、グーグルが新たに発表したGemini 2.5 Pro Experimentalは、これまでで最も先進的なAIモデルとして高く評価されている。グーグル待望の「Thinking Models」シリーズの第一弾として登場したこのモデルは、最大100万トークンのコンテキスト・ウィンドウと、一連の目覚ましい性能向上をもたらした。これは、「紅楼夢」2冊分を一度に処理する能力に相当する。

Last Human Exam "テストでは、18.81 TP3Tという最高得点を達成し、これは未使用の(外部ツールによる)大規模モデルの中で断トツのベストスコアとなりました。"Last Human Exam "は、大規模言語モデルの能力の限界を評価するために、世界中の約1,000人の専門家によって設計されたマルチモーダルベンチマークテストです。このテストは、数学、人文科学、自然科学など幅広い分野をカバーする3,000問の最先端の問題で構成されています。

ジェミニ2.5プロは、ビッグモデルアリーナテストでも、Grok-3とGPT-4.5を40点以上も上回り、史上最大の得点差でトップに立った。

 

グーグル・ディープマインドのチーフ・サイエンティストであるジェフ・ディーン氏は、ブログの中で「我々のGemini 2.5 Proモデルは、Gemini 2.0シリーズよりも大幅に改善されている。 LiveBenchのチャートでかなりの差をつけてトップになったのは素晴らしいことです。"

次に、有利なジェミニ2.5プロの実験のどのような点が飛躍をもたらすのだろうか?

1.推理力プロ・マックス版

Googleの公式ウェブサイトによると、Gemini 2.5 Proは、高度な推論を必要とするさまざまなベンチマークでリードしている。多数決のような試験時間を増やすテクニックなしで、2.5 ProはGPQAやAIME 2025のような数学と科学のベンチマークでリードしている。

例えば、テキストプロンプトと詳細な学習ノートを使ってQEDの導出を構築することができる:

もう一つの例は、2.5 Proに任せて、より少ない労力で論文を書きたい場合だ:
ノボ博士Gemini 2.5 proのおかげで、"Hybrid Models for Understanding Continuous to Discrete Neural Transformations"(連続から離散への神経変換を理解するためのハイブリッドモデル)に関する15ページの研究論文を、LaTexで逐語的に仕上げることができました!これで何時間も汗をかかずに済んだ!他のすべてのモデルを試したが、すべて20%のミッション進行で失敗した.

2.コーディング能力Pro Maxバージョン

Googleの公式発表によると、Gemini 2.5 Pro Experimentalはバージョン2.0から大きな飛躍を遂げ、今後さらなる改良が加えられる予定である。プロキシコード評価の業界標準であるSWE-Bench Verifiedにおいて、Gemini 2.5 Proは、カスタムプロキシ設定で63.8%を記録しました。

具体的には、2.5 Proは、その推論機能を使用して、1行のプロンプトから実行可能コードを生成してビデオゲームを作成することができます。

ジェフ・ディーンもまた、"p5js exploring the Mandelbrot set "というプロンプトでGemini 2.5 Proモデルによって書かれたコードをツイッターに投稿した:

III. 2.5プロ・ワンクリック・ユーザー・マニュアル

全体として、2.5 Proは、完全なウェブサイト・アーキテクチャを構築する能力を備え、明示的なコマンドをキャプチャし、正確に実行する。

2.5プロを簡単かつ効率的に使用するには、次の3つの方法で直接行えます:

1、グーグル公式:http://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-pro-exp-03-25

2.シャツAI:https://www.myshirtai.com/signup

3. APIコールhttps://api.mygptmeta.com/

偶然にも、Deepseek v3.1と2.5 Proはほぼ30時間しか違わずにリリースされた。多くのネットユーザーが比較している:

また、両モデルに「回転する4次元四次元立方体の中でバウンドするボールを図示するhtmlスクリプトを書いてください。ボールがある面に接触したら、その面をハイライトする。"実際の見せ方としては、両モデルともそれぞれ特徴があり、ユーザーの指示を的確にこなしている。しかし、比較すると、2.5 Proはよりミニマルなスタイルで、視認性に優れた仕事をしてくれるだろう。
作業シナリオや学習シナリオによって要求されるものが異なるため、その内容に応じて最適なモデルを選択することで、生産性を向上させることができる。

Gemini 2.5 Pro、GPT Plus、Claude Pro、Grok Superの公式有料専用アカウントをご利用になりたい場合、アカウントのトップアップ方法がわからない場合は、当社の専門チーム(wx: f15303420735)までお問い合わせください。

その他の製品については

詳細はこちら

シャツAI - 貫通する知性 AIGCビッグモデル:工学と科学の二大革命の時代を切り開く - Penetrating Intelligence
クロードとGPTの1:1復元 公式サイト - AI Cloud Native ライブマッチアプリ グローバルHDスポーツ観戦プレーヤー(推奨) - Blueshirt Technology
公式APIに基づくトランジットサービス - GPTMeta API GPTでの質問の仕方を教えてください。 - 知識
グローバルバーチャルグッズデジタルストア - グローバルスマートーン(馮玲葛) GPTが瞬時にいい匂いを感じなくなるクロード・エアトファクト機能の実力は?-ピーピーピー