データ爆発時代において、データ分析はビジネスの意思決定の中核となっている。しかし、データサイエンティストの不足、高い人件費、従来のデータ分析ツールの学習敷居の高さが、多くの企業を躊躇させている。本日は革命的なオープンソースプロジェクト--DeepAnalyzeは、このような問題を簡単に解決してくれる。AIデータサイエンティスト!
DeepAnalyzeとは?
ディープアナライズは自律的データサイエンスのための初のエージェントベース大規模言語モデル(Agentic LLM)は、中国人民大学と清華大学のチームによって共同開発された。従来のデータ分析タスクを実行するだけでなく、人間のデータサイエンティストのように行動することもできる。自律的なスケジューリングと最適化生データからアナリストレベルの調査レポートまで、データサイエンス・プロセス全体の真の「エンド・ツー・エンド」自動化。
💡 主なブレークスルーDeepAnalyze-8B(8Bパラメータのみ)は、いくつかのベンチマークでGPT-4o-miniなどの商用ビッグモデルを凌駕しています。オープンデータ研究オープンソースモデル。
DeepAnalyzeの5つのコア機能
1️⃣ エンド・ツー・エンドのデータ・サイエンス・パイプライン
DeepAnalyzeはデータサイエンスのプロセス全体を自動化します:
- データ準備欠損値の自動処理、重複排除、フォーマット変換
- データ分析統計指標の計算、データパターンの特定
- データモデリング予測モデルの構築と性能評価
- データの可視化プロフェッショナルなチャートと視覚化レポートの作成
- レポート作成アナリストレベルの専門的なレポートを出力

2️⃣ オープンデータ研究
従来のツールとは異なり、DeepAnalyzeはあらかじめ定義されたプロセスに限定されない:
- 自主探索人間のデータサイエンティストのように「考える」データソース
- 柔軟な対応複数のデータ形式:CSV、Excel、JSON、データベース、Markdownなど。
- 根深い真に洞察に満ちた分析を提供する、データの背後にあるストーリー
複数のデータファイルをアップロードすると、DeepAnalyzeは自動的に学生の入学パターンや機関別編入ネットワークを分析し、専門的なグラフやチャートを含む詳細な調査レポートを作成します。

3️⃣ 人の手を介さない自律性
DeepAnalyzeの最も強力な機能は以下の通りです。自律的なスケジューリングと最適化能力だ:
- まず企てるパスの分析
- そのあとプロアクティブ・エクスプローラー数字
- 順々に理解データ構造
- はこびだすデータの準備と分析
- 究極専門的なレポートの作成
全プロセスは、事前に定義されたワークフローを必要とせず、人間と同じように考え、しかも人間よりも効率的で正確である!

4️ ⃣ 複数データソースのサポート
DeepAnalyzeは、さまざまなデータ形式を扱うことができます:
- 📊 構造化データCSV、エクセル、データベース
- 📦 半構造化データjson、xml、yaml
- 📝 非構造化データTXT、マークダウン
お客様のデータがどのような形式であっても、DeepAnalyzeはそれを「理解」し、深く分析します。

5️⃣ 完全オープンソース
DeepAnalyzeの最大の強みは以下の通りである。完全なオープンソース::
- モデルウエイト オープンソース
- コードは完全にオープン
- トレーニングデータは公開されている
- デプロイメント・チュートリアルの詳細
独自のデータ・サイエンス・アシスタントを持つために、クローズド・ソースのAPIに頼る必要はない!

DeepAnalyzeはどのように機能するのか?テクニカル分析
DeepAnalyzeの革新性は、次の点にある。カリキュラムに基づくエージェント・トレーニング(カリキュラムに基づくエージェント・トレーニング)とデータガイド付き軌道合成技術だ:
🤎 5つの中核的相互作用行動
DeepAnalyzeは5つの特別なアクションタグによって自律的に動作する:
分析⟨⟩。分析と計画理解する⟩。データ構造の理解コード ⟨ コード ⟩データ解析コードの生成実行⟨⟩。コードを実行し、結果を得る答え⟨ 27E9最終報告書の作成
これらの動作により、DeepAnalyzeは人間のように振る舞うことができる。シンク・アクト・フィードバック分析プロセスを継続的に最適化する。

📚 コース・ベースのトレーニング方法
DeepAnalyzeは「単純なものから複雑なものへ」というトレーニング戦略を採用している:
- シングル容量の微調整基本的な能力をまず身につける(データ理解、コード生成など)
- マルチ・コンピテンシー・エージェント・トレーニング複雑な問題を解決するために複数の能力を組み合わせることを学ぶ
- 学習の最適化実環境における意思決定の継続的改善
この学習方法は、複雑なデータタスクにおける従来のLLMの「報酬のまばらさ」の問題を解決し、モデルが真に「データサイエンティストのように考える」ことを学習することを可能にする。

DeepAnalyzeの導入方法:実践的なチュートリアル
📦 準備
- コードベースのクローン::
git clone https://github.com/ruc-datalab/DeepAnalyze.git
cd DeepAnalyze- 仮想環境の構築::
conda create -n deepanalyze python=3.12 -y
condaはdeepanalyzeをアクティブにする- 依存関係のインストール::
pip install -r requirements.txt
#トレーニングの依存関係
(cd ./deepanalyze/ms-swift/ && pip install -e .)
(cd .(/deepanalyze/SkyRL/ && pip install -e .)🚀 展開モデル
- ダウンロードモデル::
- DeepAnalyze-8Bを直接ダウンロードできます。
- またはDeepSeek-R1-0528-Qwen3-8Bに基づいて微調整された。
- サービス開始::
cd demo/chat
npm インストール
cd .
bash start.sh- アクセスインターフェイス::
- ブラウザを開いてアクセスする
http://localhost:4000 - データファイルのアップロードと分析指示の入力
🌐 API呼び出しメソッド
また、APIを介して独自のシステムに統合することもできる:
python demo/backend.pyそれからcurlを使ってAPIをテストする:
curl -X POST http://localhost:8200/chat/completions \
-H "Content-Type: application/json"
-d '{"messages": [{"role": "user", "content": "Generate a data science report."}], "workspace": "example/student_loan/"}'.3つのステップでプロフェッショナルなレポートを作成
実際の使用例を見てみよう:
- データの準備分析するデータファイルを作業ディレクトリに置く。
例/学生ローン) - 委任状の提出::
from deepanalyze import DeepAnalyzeVLLM
prompt = """#命令
データサイエンス・レポートを作成します。
#データ
ファイル1:{"name": "bool.xlsx", "size": "4.8KB"}.
ファイル2:{"name": "person.csv", "size": "10.6KB"} ...
...(その他のファイルの説明)"""
ワークスペース = "/path/to/your/workspace"
deepanalyze = DeepAnalyzeVLLM("path/to/DeepAnalyze-8B/")
answer = deepanalyze.generate(prompt, workspace=workspace)- 結果を出す::
- のリストが表示されます。専門的な図表、統計分析、ビジネスアドバイス女性差別撤廃委員会報告書全文
- レポートに直接使用するためのPDFフォーマットへのエクスポートをサポート

DeepAnalyzeを選ぶ理由
| 性格描写 | ディープアナライズ | 伝統的な道具 | クローズド・ソースAPI |
|---|---|---|---|
| 自治 | ✅ プロセス全体の自律的な振り付け | ❌ 要マニュアル指導 | ⚠️ 限定された自治権 |
| データフォーマットのサポート | 複数のフォーマット | ⚠️ サポートは限定的 | サポート |
| ざいげんをひろげる | 完全なオープンソース | ✅ | ❌ |
| (製造原価 | ✅ 一回限りの配備 | ✅ | ❌ 高い利用料 |
| カスタマイズ性 | 完全にカスタマイズ可能 | ⚠️ 有限会社 | ❌ |
自律的データサイエンスの新時代を迎える
DeepAnalyzeは、データサイエンスの新しい方向性を示しています。ワークフロー主導からAI自律主導へ.それは単なる道具ではなく、あなたのものなのだ。24時間オンライン・データ・サイエンス・チームお客様のビジネスニーズを理解し、複雑なデータ分析タスクのオーナーシップを持つことができる。
🌟 緊急措置アクセス GitHubリポジトリ 完全なコードとチュートリアルを入手して、自律的なデータ分析への旅を今すぐ始めましょう!