DeepAnalyze:AIをあなたの専属データサイエンティストに!オープンソースプロジェクトの詳細分析

データ爆発時代において、データ分析はビジネスの意思決定の中核となっている。しかし、データサイエンティストの不足、高い人件費、従来のデータ分析ツールの学習敷居の高さが、多くの企業を躊躇させている。本日は革命的なオープンソースプロジェクト--DeepAnalyzeは、このような問題を簡単に解決してくれる。AIデータサイエンティスト!

DeepAnalyzeとは?

ディープアナライズは自律的データサイエンスのための初のエージェントベース大規模言語モデル(Agentic LLM)は、中国人民大学と清華大学のチームによって共同開発された。従来のデータ分析タスクを実行するだけでなく、人間のデータサイエンティストのように行動することもできる。自律的なスケジューリングと最適化生データからアナリストレベルの調査レポートまで、データサイエンス・プロセス全体の真の「エンド・ツー・エンド」自動化。

💡 主なブレークスルーDeepAnalyze-8B(8Bパラメータのみ)は、いくつかのベンチマークでGPT-4o-miniなどの商用ビッグモデルを凌駕しています。オープンデータ研究オープンソースモデル。

DeepAnalyzeの5つのコア機能

1️⃣ エンド・ツー・エンドのデータ・サイエンス・パイプライン

DeepAnalyzeはデータサイエンスのプロセス全体を自動化します:

  • データ準備欠損値の自動処理、重複排除、フォーマット変換
  • データ分析統計指標の計算、データパターンの特定
  • データモデリング予測モデルの構築と性能評価
  • データの可視化プロフェッショナルなチャートと視覚化レポートの作成
  • レポート作成アナリストレベルの専門的なレポートを出力

2️⃣ オープンデータ研究

従来のツールとは異なり、DeepAnalyzeはあらかじめ定義されたプロセスに限定されない:

  • 自主探索人間のデータサイエンティストのように「考える」データソース
  • 柔軟な対応複数のデータ形式:CSV、Excel、JSON、データベース、Markdownなど。
  • 根深い真に洞察に満ちた分析を提供する、データの背後にあるストーリー

複数のデータファイルをアップロードすると、DeepAnalyzeは自動的に学生の入学パターンや機関別編入ネットワークを分析し、専門的なグラフやチャートを含む詳細な調査レポートを作成します。

3️⃣ 人の手を介さない自律性

DeepAnalyzeの最も強力な機能は以下の通りです。自律的なスケジューリングと最適化能力だ:

  • まず企てるパスの分析
  • そのあとプロアクティブ・エクスプローラー数字
  • 順々に理解データ構造
  • はこびだすデータの準備と分析
  • 究極専門的なレポートの作成

全プロセスは、事前に定義されたワークフローを必要とせず、人間と同じように考え、しかも人間よりも効率的で正確である!

4️ ⃣ 複数データソースのサポート

DeepAnalyzeは、さまざまなデータ形式を扱うことができます:

  • 📊 構造化データCSV、エクセル、データベース
  • 📦 半構造化データjson、xml、yaml
  • 📝 非構造化データTXT、マークダウン

お客様のデータがどのような形式であっても、DeepAnalyzeはそれを「理解」し、深く分析します。

5️⃣ 完全オープンソース

DeepAnalyzeの最大の強みは以下の通りである。完全なオープンソース::

  • モデルウエイト オープンソース
  • コードは完全にオープン
  • トレーニングデータは公開されている
  • デプロイメント・チュートリアルの詳細

独自のデータ・サイエンス・アシスタントを持つために、クローズド・ソースのAPIに頼る必要はない!

DeepAnalyzeはどのように機能するのか?テクニカル分析

DeepAnalyzeの革新性は、次の点にある。カリキュラムに基づくエージェント・トレーニング(カリキュラムに基づくエージェント・トレーニング)とデータガイド付き軌道合成技術だ:

🤎 5つの中核的相互作用行動

DeepAnalyzeは5つの特別なアクションタグによって自律的に動作する:

  • 分析⟨⟩。分析と計画
  • 理解する⟩。データ構造の理解
  • コード ⟨ コード ⟩データ解析コードの生成
  • 実行⟨⟩。コードを実行し、結果を得る
  • 答え⟨ 27E9最終報告書の作成

これらの動作により、DeepAnalyzeは人間のように振る舞うことができる。シンク・アクト・フィードバック分析プロセスを継続的に最適化する。

📚 コース・ベースのトレーニング方法

DeepAnalyzeは「単純なものから複雑なものへ」というトレーニング戦略を採用している:

  1. シングル容量の微調整基本的な能力をまず身につける(データ理解、コード生成など)
  2. マルチ・コンピテンシー・エージェント・トレーニング複雑な問題を解決するために複数の能力を組み合わせることを学ぶ
  3. 学習の最適化実環境における意思決定の継続的改善

この学習方法は、複雑なデータタスクにおける従来のLLMの「報酬のまばらさ」の問題を解決し、モデルが真に「データサイエンティストのように考える」ことを学習することを可能にする。

DeepAnalyzeの導入方法:実践的なチュートリアル

📦 準備

  1. コードベースのクローン::
PHP
git clone https://github.com/ruc-datalab/DeepAnalyze.git
cd DeepAnalyze
  1. 仮想環境の構築::
PHP
conda create -n deepanalyze python=3.12 -y
condaはdeepanalyzeをアクティブにする
  1. 依存関係のインストール::
PHP
pip install -r requirements.txt
#トレーニングの依存関係
(cd ./deepanalyze/ms-swift/ && pip install -e .)
(cd .(/deepanalyze/SkyRL/ && pip install -e .)

🚀 展開モデル

  1. ダウンロードモデル::
  • DeepAnalyze-8Bを直接ダウンロードできます。
  • またはDeepSeek-R1-0528-Qwen3-8Bに基づいて微調整された。
  1. サービス開始::
PHP
cd demo/chat
npm インストール
cd .
bash start.sh
  1. アクセスインターフェイス::
  • ブラウザを開いてアクセスする http://localhost:4000
  • データファイルのアップロードと分析指示の入力

🌐 API呼び出しメソッド

また、APIを介して独自のシステムに統合することもできる:

PHP
python demo/backend.py

それからcurlを使ってAPIをテストする:

PHP
curl -X POST http://localhost:8200/chat/completions  \
-H "Content-Type: application/json"
-d '{"messages": [{"role": "user", "content": "Generate a data science report."}], "workspace": "example/student_loan/"}'.

3つのステップでプロフェッショナルなレポートを作成

実際の使用例を見てみよう:

  1. データの準備分析するデータファイルを作業ディレクトリに置く。例/学生ローン)
  2. 委任状の提出::
PHP
from deepanalyze import DeepAnalyzeVLLM

prompt = """#命令
データサイエンス・レポートを作成します。

#データ
ファイル1:{"name": "bool.xlsx", "size": "4.8KB"}.
ファイル2:{"name": "person.csv", "size": "10.6KB"} ...
...(その他のファイルの説明)"""

ワークスペース = "/path/to/your/workspace"
deepanalyze = DeepAnalyzeVLLM("path/to/DeepAnalyze-8B/")
answer = deepanalyze.generate(prompt, workspace=workspace)
  1. 結果を出す::
  • のリストが表示されます。専門的な図表、統計分析、ビジネスアドバイス女性差別撤廃委員会報告書全文
  • レポートに直接使用するためのPDFフォーマットへのエクスポートをサポート

DeepAnalyzeを選ぶ理由

性格描写ディープアナライズ伝統的な道具クローズド・ソースAPI
自治✅ プロセス全体の自律的な振り付け❌ 要マニュアル指導⚠️ 限定された自治権
データフォーマットのサポート複数のフォーマット⚠️ サポートは限定的サポート
ざいげんをひろげる完全なオープンソース
(製造原価✅ 一回限りの配備❌ 高い利用料
カスタマイズ性完全にカスタマイズ可能⚠️ 有限会社

自律的データサイエンスの新時代を迎える

DeepAnalyzeは、データサイエンスの新しい方向性を示しています。ワークフロー主導からAI自律主導へ.それは単なる道具ではなく、あなたのものなのだ。24時間オンライン・データ・サイエンス・チームお客様のビジネスニーズを理解し、複雑なデータ分析タスクのオーナーシップを持つことができる。

🌟 緊急措置アクセス GitHubリポジトリ 完全なコードとチュートリアルを入手して、自律的なデータ分析への旅を今すぐ始めましょう!

その他の製品については

詳細はこちら

シャツAI - 貫通する知性 AIGCビッグモデル:工学と科学の二大革命の時代を切り開く - Penetrating Intelligence
クロードとGPTの1:1復元 公式サイト - AI Cloud Native ライブマッチアプリ グローバルHDスポーツ観戦プレーヤー(推奨) - Blueshirt Technology
公式APIに基づくトランジットサービス - GPTMeta API GPTでの質問の仕方を教えてください。- 知識
グローバルバーチャルグッズデジタルストア - グローバルスマートーン(馮玲葛) GPTが瞬時にいい匂いを感じなくなるクロード・エアトファクト機能の実力は?-ピーピーピー