أصدرت DeepSeek نموذج Prover-V2، ويبلغ عدد المعلمات 6710 مليار.

GateUser-6433627c · 2025-04-30T12:36:26+00:00

أصدرت DeepSeek نموذج Prover-V2، الذي يحتوي على 671 مليار معلمة، ويستخدم تنسيق ملفات safetensors الفعال، ويدعم دقة حسابية متعددة، ويعتمد على بنية DeepSeek-V3، ووضع MoE، و61 طبقة Transformer، وطبقة خفية بأبعاد 7168، ويدعم السياقات الفائقة الطول و FP8 الكمي. هذا يجعل النموذج أسرع وأكثر كفاءة في استخدام الموارد للتدريب والنشر، مما يجعله مناسبًا لإثباتات رياضية معقدة. ( المصدر: جين10 )

GateUser-6433627c

2025-04-30 12:36:26

إنشاء الملخص قيد التقدم

[DeepSeek تطلق نموذج Prover-V2 مع 671 مليار معلمة] أصدرت DeepSeek اليوم نموذجا جديدا يسمى DeepSeek-Prover-V2-671B على Hugging Face ، وهو مجتمع الذكاء الاصطناعي مفتوح المصدر. يذكر أن DeepSeek-Prover-V2-671B يستخدم تنسيق ملف Safetensors أكثر كفاءة ويدعم مجموعة متنوعة من دقة الحساب ، وهو مناسب للتدريب والنشر على النموذج بشكل أسرع وأكثر توفيرا للموارد ، مع 671 مليار معلمة ، أو نسخة مطورة من النموذج الرياضي Prover-V1.5 الذي تم إصداره العام الماضي. فيما يتعلق بهندسة النموذج ، يستخدم النموذج بنية DeepSeek-V3 ، ويعتمد وضع MoE (Hybrid Expert) ، ويحتوي على 61 طبقة محول و 7168 طبقة مخفية أبعاد. في الوقت نفسه ، يدعم السياقات الطويلة للغاية ، مع تضمين أقصى موضع يصل إلى 163,800 ، مما يمكنه من معالجة البراهين الرياضية المعقدة ، ويتم اعتماد تكميم FP8 ، والذي يمكن أن يقلل من حجم النموذج ويحسن كفاءة الاستدلال من خلال تقنية التكميم. ( ذهب عشرة )

DEEPSEEK‎-5.6%

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.