03:22
حقق Kimi K2 Thinking أرقامًا قياسية جديدة في تقييمات الأداء الأساسية التي تقيم قدرات الاستنتاج، والبرمجة، والوكالة
بيانات金十 في 8 نوفمبر، وفقًا لموقع Moon's Dark Side، أن Kimi K2 Thinking حقق أرقامًا قياسية جديدة في تقييمات الأداء الأساسية في الاستدلال، الترميز، والقدرات الوكيلة. حقق K2 Thinking معدل أداء قياسي جديد بنسبة 44.9% في تقييم HLE، ووصل إلى 60.2% في اختبار BrowseComp، وفي اختبار SWE-Bench

