تذكر عندما كانت النماذج الأساسية مجرد آلات مطابقة أنماط؟ كانوا يتعاملون مع بيانات التدريب، ويتوقعون الرمز التالي مرارًا وتكرارًا. أشياء ميكانيكية جدًا.
ثم غيّر InstructGPT قواعد اللعبة. الخدعة؟ تعديل تلك النماذج الخام باستخدام أزواج التعليمات والاستجابات. فجأة، أصبح بإمكانهم الدردشة بشكل طبيعي، واتباع ما تطلبه فعلاً - كل ذلك مع الحفاظ على تلك المعرفة العميقة التي تعلموها بالفعل.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 18
أعجبني
18
7
إعادة النشر
مشاركة
تعليق
0/400
zkProofInThePudding
· منذ 6 س
ها، إن InstructGPT تلك بالفعل قد تجاوزت الدفاع، من مجرد توقعات ميكانيكية للتوكن إلى القدرة على فهم الكلام البشري حقًا... إنها قفزة نوعية!
شاهد النسخة الأصليةرد0
AlphaWhisperer
· منذ 11 س
صراحة، يبدو أن الخطوة من توقع الرمز إلى اتباع التعليمات هي المفتاح الحقيقي الذي يجعل هذه النماذج تنبض بالحياة. كانت النماذج الأساسية السابقة مجرد نسخة محسنة من الببغاوات، والآن أصبحت قادرة أخيرًا على فهم اللغة البشرية.
شاهد النسخة الأصليةرد0
AirdropFreedom
· منذ 11 س
أعتقد أن InstructGPT كانت بالفعل نقطة تحول، لكن بصراحة فإن هذه النماذج الآن لا تزال تلعب بالألعاب، وليست ذكية كما تخيلنا.
شاهد النسخة الأصليةرد0
TopBuyerForever
· منذ 11 س
هههه في ذلك الوقت كان النموذج مجرد آلة تكرار غبية، والآن عندما أفكر في الأمر، يبدو الأمر مضحكًا بعض الشيء.
شاهد النسخة الأصليةرد0
HorizonHunter
· منذ 11 س
بصراحة، كانت عملية InstructGPT مذهلة حقًا، لقد انتقلنا من مجرد توقع التوكن التالي إلى فهم التعليمات بشكل حقيقي... هذه النقلة ليست بهذه السهولة، أليس كذلك؟
شاهد النسخة الأصليةرد0
TokenTaxonomist
· منذ 11 س
لا، هذا غير مكتمل تصنيفياً بصراحة... إنهم يتجاهلون الانحراف المعماري الفعلي الذي حدث بعد RLHF. وفقًا لتحليلي، كان ضبط التعليمات مجرد إدارة للأعراض، وليس التحول التطوري الجذري. دعني أفتح جدول البيانات الخاص بي بسرعة - تشير البيانات إلى أن الانعطافة الحقيقية كانت نموذج مكافأة منهجي، من الناحية الإحصائية بالطبع.
شاهد النسخة الأصليةرد0
OffchainOracle
· منذ 11 س
بصراحة، كانت تلك العملية من InstructGPT مذهلة حقًا، فقط من خلال هذه التعديلات الصغيرة أحيوا النموذج الكبير.
AGI Runtime: كيف وصلنا إلى هنا
تذكر عندما كانت النماذج الأساسية مجرد آلات مطابقة أنماط؟ كانوا يتعاملون مع بيانات التدريب، ويتوقعون الرمز التالي مرارًا وتكرارًا. أشياء ميكانيكية جدًا.
ثم غيّر InstructGPT قواعد اللعبة. الخدعة؟ تعديل تلك النماذج الخام باستخدام أزواج التعليمات والاستجابات. فجأة، أصبح بإمكانهم الدردشة بشكل طبيعي، واتباع ما تطلبه فعلاً - كل ذلك مع الحفاظ على تلك المعرفة العميقة التي تعلموها بالفعل.