DeepSeek veröffentlicht Prover-V2-Modell: 671B-Parameter verbessern mathematisches Theorem-Provening
DeepSeek hat am 1. Mai das Modell DeepSeek-Prover2 für mathematische Beweise veröffentlicht, das 671 Milliarden Parameter und eine Version mit 7 Milliarden Parametern enthält. Das Modell nutzt eine Kombination aus Rekursion und Reinforcement Learning, um in verschiedenen Mathe-Tests zu glänzen, wie z. B. dem MiniFF-Test mit einer Erfolgsquote von 88,9%. Der gleichzeitig veröffentlichte ProBench-Datensatz enthält 325 Fragen zur Bewertung der Fähigkeiten des Modells. Experimente haben ergeben, dass das Chain-of-Thought-Modell die Genauigkeit deutlich verbessert, wobei das Mini-Modell bei bestimmten Problemen sogar besser abschneidet als das Modell. Das Modell ist bereits bei Hugging Face im Einsatz und unterstützt ein neues Paradigma in der mathematischen Forschung.
