DeepSeek lanza el modelo Prover-V2, con una cantidad de parámetros de 6710 millones.

GateUser-6433627c · 2025-04-30T12:36:26+00:00

DeepSeek ha lanzado el modelo Prover-V2, que tiene una cantidad de parámetros de 671 mil millones, utiliza el formato de archivo eficiente safetensors, admite múltiples precisiones de cálculo, utiliza la arquitectura DeepSeek-V3, modo MoE, 61 capas de Transformer, capa oculta de 7168 dimensiones, y admite contextos ultralargos y cuantificación FP8. Esto hace que el modelo sea más rápido y consuma menos recursos para entrenar y desplegar, siendo adecuado para pruebas matemáticas complejas. ( fuente: Jin10 )

GateUser-6433627c

2025-04-30 12:36:26

Generación de resúmenes en curso

[DeepSeek lanza el modelo Prover-V2 con 671 mil millones de parámetros] DeepSeek lanzó hoy un nuevo modelo llamado DeepSeek-Prover-V2-671B en Hugging Face, una comunidad de IA de código abierto. Se informa que DeepSeek-Prover-V2-671B utiliza un formato de archivo safetensors más eficiente y admite una variedad de precisiones de cálculo, lo cual es conveniente para un entrenamiento e implementación de modelos más rápidos y que ahorran más recursos, con 671 mil millones de parámetros, o una versión mejorada del modelo matemático Prover-V1.5 lanzado el año pasado. En cuanto a la arquitectura del modelo, el modelo utiliza la arquitectura DeepSeek-V3, adopta el modo MoE (Hybrid Expert) y tiene 61 capas Transformer y 7168 capas ocultas dimensionales. Al mismo tiempo, admite contextos ultralargos, con una incrustación de posición máxima de hasta 163.800, lo que le permite procesar pruebas matemáticas complejas, y se adopta la cuantificación FP8, que puede reducir el tamaño del modelo y mejorar la eficiencia de la inferencia a través de la tecnología de cuantificación. ( de oro diez )

DEEPSEEK1,37%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.