Ingat ketika model dasar hanyalah mesin pencocokan pola? Mereka akan menganalisis data pelatihan, memprediksi token berikutnya berulang kali. Cukup mekanis.
Kemudian InstructGPT mengubah permainan. Triknya? Menyempurnakan model mentah tersebut dengan pasangan instruksi-respons. Tiba-tiba mereka bisa berbicara secara alami, benar-benar mengikuti apa yang Anda tanyakan - semua sambil mempertahankan pengetahuan mendalam yang telah mereka pelajari.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
17 Suka
Hadiah
17
7
Posting ulang
Bagikan
Komentar
0/400
zkProofInThePudding
· 2jam yang lalu
Hah, InstructGPT memang berhasil menembus pertahanan, dari prediksi token yang murni mekanis hingga benar-benar dapat memahami bahasa manusia... lompatan kualitas yang luar biasa.
Lihat AsliBalas0
AlphaWhisperer
· 6jam yang lalu
Sejujurnya, langkah dari prediksi token hingga mengikuti instruksi ini adalah kunci yang benar-benar membuat model-model ini hidup. Model-model dasar sebelumnya hanyalah versi penguat dari burung beo, sekarang akhirnya bisa memahami bahasa manusia.
Lihat AsliBalas0
AirdropFreedom
· 6jam yang lalu
Saya rasa InstructGPT memang merupakan titik balik, tapi sejujurnya model-model ini masih bermain-main, tidak secerdas yang dibayangkan.
Lihat AsliBalas0
TopBuyerForever
· 6jam yang lalu
Haha, model saat itu benar-benar hanya mesin pengulang bodoh, sekarang memikirkannya agak lucu.
Lihat AsliBalas0
HorizonHunter
· 6jam yang lalu
ngl Operasi InstructGPT itu memang luar biasa, dari prediksi token berikutnya yang murni langsung melompat ke pemahaman instruksi yang sebenarnya... Perubahan ini sebenarnya tidak semudah itu, kan?
Lihat AsliBalas0
TokenTaxonomist
· 7jam yang lalu
nah ini secara taksonomi tidak lengkap sejujurnya... mereka mengabaikan perbedaan arsitektural yang sebenarnya terjadi pasca-RLHF. menurut analisis saya, penyetelan instruksi hanyalah manajemen gejala, bukan pergeseran evolusi yang mendasar. biarkan saya membuka spreadsheet saya dengan cepat—data menunjukkan bahwa infleksi yang sebenarnya adalah pemodelan hadiah sistematis, secara statistik tentu saja
Lihat AsliBalas0
OffchainOracle
· 7jam yang lalu
Sejujurnya, tindakan InstructGPT itu benar-benar luar biasa, hanya dengan sedikit penyesuaian langsung membuat model besar itu hidup kembali.
AGI Runtime: Bagaimana Kami Sampai Di Sini
Ingat ketika model dasar hanyalah mesin pencocokan pola? Mereka akan menganalisis data pelatihan, memprediksi token berikutnya berulang kali. Cukup mekanis.
Kemudian InstructGPT mengubah permainan. Triknya? Menyempurnakan model mentah tersebut dengan pasangan instruksi-respons. Tiba-tiba mereka bisa berbicara secara alami, benar-benar mengikuti apa yang Anda tanyakan - semua sambil mempertahankan pengetahuan mendalam yang telah mereka pelajari.