キミK2思考、突如公開! GPT-5を超える1兆パラメータ・オープンソースビースト

"人手を介さずにツールを300回連続で呼び出せる能力こそ、真の思考力である"

昨晩、国産大型モデル界に激震が走った--「ダークサイド・オブ・ムーン」正式発表 キミ・K2・シンキングを持つ新製品である。 1兆パラメータ オープンソースのThink Agentモデル。

ハギング・フェイスの共同設立者であるトーマス・ウルフは大喜びだった。私たちはディープシークの瞬間を目撃している。「AI研究の第一人者であるセバスチャン・ラシュカは次のように分析する。より多くの専門家、より少ないHEAD、より多くの思考"; Reddit Hot Topicのコメント:"オープンソースのモデルは、クローズドソースのフロンティアに最も近い。

このモデルの何が世界のAIコミュニティーをざわつかせているのか?本日はその謎に迫る。

ただ大きいだけでなく、考える力がある。

キミK2シンキングは普通のアップグレードではなく、完全に再設計されたシンキング・エージェントである:

複雑なマルチステップタスクのツールコールを、人手を介さずに200~300回連続で実行。

受動的にしか答えられない従来の大きなモデルとは異なり、K2シンキングは能動的に考え、質問し、検証し、調整し、人間のように考え、行動する。

規範K2思考伝統的モデル
ツールコール200~300コール連続通常1~3回
思考プロセス推論の連鎖を明示的に示す推論プロセスを隠す
対話モードアクティブ・サーチ+思考+実行受動応答
ミッションの種類多段階の複雑な作業単純作業

⚡ テクニカル・アンダーカード:1Tパラメータに隠された秘密

1️⃣ 量的なブレークスルー:INT4は妥協ではなく、戦略である。

競合他社が採用したFP8と比較して、K2シンクはINT4を数値化することを選択した。これは技術的なブレークスルーであるだけでなく、戦略的な配慮でもある:

  • 倍速発電速度を約2倍向上
  • ハードウェア互換性国産アクセラレーション・コンピューティング・チップにもっと親しみを
  • パフォーマンスの低下なし定量的意識向上トレーニング(QAT)を通じて、パフォーマンスを低下させることなく維持する。

「M3 Ultraチップを搭載した2台のMacは、INT4 Compressedをほとんど性能低下なくスムーズに実行できる。--Apple Bully、Awni Hannun、テストシェア

2️⃣ 建築の革新:専門家が増え、頭数が減る

DeepSeek R1と比較して、K2 Thinkingはより合理的なアーキテクチャを採用している:

  • より多くの専門家モデル知識の幅を広げる
  • 頭数が少ない計算の冗長性を減らす
  • 代替思考考える」と「実行する」のサイクルで推論の一貫性を高める

3️⃣ トレーニング費用:460万ドル 精密投資

CNBCによると、K2シンキングはトレーニングに460万ドルかかるという。モデルのトレーニングに数千万ドルを費やすのに比べ、ダークサイド・オブ・ザ・ムーンは正確で効率的なトレーニング戦略でパフォーマンスを最大化する。1セントたりとも無駄にしない。

GPT-5のSOTAスコアを上回る Ὂ パフォーマンスの実際

K2シンクは、数々の権威あるベンチマークテストで驚異的な強さを示している:

ᔍ インテリジェントな身体能力:真に自律的な思考

  • ベンチ・テレコムGPT-5(89%)とクロード・ソネット4.5(91%)を上回る93%の精度。
  • SEAL-0複雑な情報収集推論テスト、リフレッシュSOTA
  • ブラウズコンプ:: 60.21 TP3Tスコア、人間の平均は29.21 TP3Tのみ

統合推理:博士号レベルのパズルを解く

  • HLE(人類の究極の試験)GPT-5(43.7%)、クロード・ソネット4.5(42.8%)、Grok4(41.5%)を上回る44.9%を記録。
  • GPQAダイヤモンド高度な推理力テスト、競合製品のほとんどを凌駕

💻 行動するプログラミング:コードを書くだけでなく、問題を解決する。

  • SWE-マルチリンガル:: 61.11 TP3Tスコア
  • SWEベンチ検証済み:: 71.31 TP3Tスコア、人間のエキスパートレベルに近い
  • ターミナル・ベンチ:: 47.11 TP3Tスコア、複雑な端末環境タスクを処理可能

ハンズオンデモ:これが本物のAIアシスタントだ

ケース1:プライベート・ジャーニー・マネージャー

マンデートコンサート・ツアーを計画するための予算は1000ドルです。

K2シンキングのパフォーマンス::

  • 全工程を完了するための17のツール・コール
  • ユーザーの好み、仕事のスケジュールについて尋ねる
  • 近隣のチケット、会場、レストランの検索
  • 時間、場所、料金の詳細を含むパーソナライズされた旅程を作成します。

"本物の個人バトラーよりも細かく、レストランの名物料理まで考慮されている"

ケース2:数理物理学の視覚化

マンデート二次元勾配降下法の説明

K2シンキングのパフォーマンス::

  • 視覚化ツールの起動
  • 青い等高線、黄色のパス、赤いグラデーションの矢印。
  • 一目でわかるテキスト解説付き
  • パラメータはユーザーがインタラクティブに調整可能

ケース3:ウイルス感染シミュレーション

マンデート免疫パラメータを調整可能なウイルス・シミュレーション・プログラムの作成

K2シンキングのパフォーマンス::

  • 23のツール・コール
  • 完全にインタラクティブな番組の生成
  • 赤と青の粒子が互いに追いかけ、衝突し、食い合う
  • ウイルス複製速度、免疫細胞数を調整するスライダー
  • リアルタイム・パラメータ・フィードバックと統計

ケース4:データ分析と視覚化

マンデート:: "私が送ったCSVファイルを分析し、分析をサポートするチャートを作成する"

K2シンキングのパフォーマンス::

  • 最初の計画段階:ロードデータ→スクリーニング→分析→プロット
  • 14 Pythonコール
  • 統計分析、ビジュアライゼーション・チャート、詳細な説明を含むインタラクティブなウェブページの作成
  • 人手を介さないエラー自己修復

フリーでオープンソース:AI革命は誰もが利用できる

最もエキサイティングなのは、K2シンキングだ。完全なオープンソース養子縁組修正MITライセンス::

  • コマーシャル・フリー市販品にそのまま使用可能
  • モデル重量ハグする顔で全開
  • APIインターフェースキミ・オープン・プラットフォームが提供するサービス
  • 個人使用kimi.comとモバイル・アプリですぐに利用可能!

唯一の制限は、月間アクティブユーザーが1億人以上、または月間売上が2000万ドル以上の場合、UIに「キミK2」と目立つように表示する必要があることだ。

"これは一企業の勝利ではなく、中国のAIエコシステムにおける集団的飛躍である"-- AI企業トップのCTO

一日の終わりに書く。

キミK2シンキングの登場は、AIに対する私たちの固有の認識を覆した。もはや受動的な「チャットボット」ではなく、能動的に考え、問題を解決し、継続的に進化できる「デジタル仲間」なのだ。

オープンソースモデルがクローズドソースモデルを追い抜き始め、中国のテクノロジーが世界のAIイノベーションをリードし始める中、我々は認めざるを得ない:中国はAGIの最前線にいる。

「人間に取って代わるのではなく、人間を解放するのだ。面倒な計算や実行はAIに任せ、人間は創造と意思決定に集中する。"--ダークサイド・オブ・ザ・ムーン』エンジニアチーム

今すぐ体験::
🔗 https://kimi.com
🔗 https://huggingface.co/moonshotai/Kimi-K2-Thinking

技術ブログ::
🔗 https://moonshotai.github.io/Kimi-K2/thinking.html

その他の製品については

詳細はこちら

シャツAI - 貫通する知性 AIGCビッグモデル:工学と科学の二大革命の時代を切り開く - Penetrating Intelligence
クロードとGPTの1:1復元 公式サイト - AI Cloud Native ライブマッチアプリ グローバルHDスポーツ観戦プレーヤー(推奨) - Blueshirt Technology
公式APIに基づくトランジットサービス - GPTMeta API GPTでの質問の仕方を教えてください。- 知識
グローバルバーチャルグッズデジタルストア - グローバルスマートーン(馮玲葛) GPTが瞬時にいい匂いを感じなくなるクロード・エアトファクト機能の実力は?-ピーピーピー