DeepSeek veröffentlicht Prover-V2-Modell: 671B-Parameter verbessern mathematisches Theorem-Provening

DeepSeek hat am 1. Mai das Modell DeepSeek-Prover2 für mathematische Beweise veröffentlicht, das 671 Milliarden Parameter und eine Version mit 7 Milliarden Parametern enthält. Das Modell nutzt eine Kombination aus Rekursion und Reinforcement Learning, um in verschiedenen Mathe-Tests zu glänzen, wie z. B. dem MiniFF-Test mit einer Erfolgsquote von 88,9%. Der gleichzeitig veröffentlichte ProBench-Datensatz enthält 325 Fragen zur Bewertung der Fähigkeiten des Modells. Experimente haben ergeben, dass das Chain-of-Thought-Modell die Genauigkeit deutlich verbessert, wobei das Mini-Modell bei bestimmten Problemen sogar besser abschneidet als das Modell. Das Modell ist bereits bei Hugging Face im Einsatz und unterstützt ein neues Paradigma in der mathematischen Forschung.

DeepSeek veröffentlicht Prover-V2-Modell: 671B-Parameter verbessern mathematisches Theorem-Provening Mehr lesen "