I. はじめに
北京、3月26日、グーグルが新たに発表したGemini 2.5 Pro Experimentalは、これまでで最も先進的なAIモデルとして高く評価されている。グーグル待望の「Thinking Models」シリーズの第一弾として登場したこのモデルは、最大100万トークンのコンテキスト・ウィンドウと、一連の目覚ましい性能向上をもたらした。これは、「紅楼夢」2冊分を一度に処理する能力に相当する。
Last Human Exam "テストでは、18.81 TP3Tという最高得点を達成し、これは未使用の(外部ツールによる)大規模モデルの中で断トツのベストスコアとなりました。"Last Human Exam "は、大規模言語モデルの能力の限界を評価するために、世界中の約1,000人の専門家によって設計されたマルチモーダルベンチマークテストです。このテストは、数学、人文科学、自然科学など幅広い分野をカバーする3,000問の最先端の問題で構成されています。

ジェミニ2.5プロは、ビッグモデルアリーナテストでも、Grok-3とGPT-4.5を40点以上も上回り、史上最大の得点差でトップに立った。

グーグル・ディープマインドのチーフ・サイエンティストであるジェフ・ディーン氏は、ブログの中で「我々のGemini 2.5 Proモデルは、Gemini 2.0シリーズよりも大幅に改善されている。 LiveBenchのチャートでかなりの差をつけてトップになったのは素晴らしいことです。"

次に、有利なジェミニ2.5プロの実験のどのような点が飛躍をもたらすのだろうか?
1.推理力プロ・マックス版
Googleの公式ウェブサイトによると、Gemini 2.5 Proは、高度な推論を必要とするさまざまなベンチマークでリードしている。多数決のような試験時間を増やすテクニックなしで、2.5 ProはGPQAやAIME 2025のような数学と科学のベンチマークでリードしている。

例えば、テキストプロンプトと詳細な学習ノートを使ってQEDの導出を構築することができる:

2.コーディング能力Pro Maxバージョン
Googleの公式発表によると、Gemini 2.5 Pro Experimentalはバージョン2.0から大きな飛躍を遂げ、今後さらなる改良が加えられる予定である。プロキシコード評価の業界標準であるSWE-Bench Verifiedにおいて、Gemini 2.5 Proは、カスタムプロキシ設定で63.8%を記録しました。
具体的には、2.5 Proは、その推論機能を使用して、1行のプロンプトから実行可能コードを生成してビデオゲームを作成することができます。
III. 2.5プロ・ワンクリック・ユーザー・マニュアル
全体として、2.5 Proは、完全なウェブサイト・アーキテクチャを構築する能力を備え、明示的なコマンドをキャプチャし、正確に実行する。
2.5プロを簡単かつ効率的に使用するには、次の3つの方法で直接行えます:
1、グーグル公式:http://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-pro-exp-03-25
2.シャツAI:https://www.myshirtai.com/signup
3. APIコールhttps://api.mygptmeta.com/
偶然にも、Deepseek v3.1と2.5 Proはほぼ30時間しか違わずにリリースされた。多くのネットユーザーが比較している:
Gemini 2.5 Pro、GPT Plus、Claude Pro、Grok Superの公式有料専用アカウントをご利用になりたい場合、アカウントのトップアップ方法がわからない場合は、当社の専門チーム(wx: f15303420735)までお問い合わせください。