DeepSeek lanza el modelo Prover-V2: los parámetros 671B mejoran la comprobación de teoremas matemáticos

DeepSeek publicó el 1 de mayo el modelo DeepSeek-Prover2 diseñado para pruebas matemáticas, que contiene 671.000 millones de parámetros y una versión de 7.000 millones de parámetros. El modelo utiliza una combinación de recursividad y aprendizaje por refuerzo para destacar en varias pruebas matemáticas, como la prueba MiniFF, con un porcentaje de aprobados de 88,9%. El conjunto de datos ProBench publicado al mismo tiempo contiene 325 preguntas para evaluar las capacidades del modelo. Los experimentos han revelado que el modelo Cadena de Pensamiento mejora significativamente la precisión, y el minimodelo incluso lo supera en problemas concretos. El modelo ya está en Hugging Face, apoyando un nuevo paradigma en la investigación matemática.

DeepSeek lanza el modelo Prover-V2: los parámetros 671B mejoran la comprobación de teoremas matemáticos Leer más "