Saya merasa banyak orang salah memahami thinking dan mode biasa, menganggap thinking selalu baik, padahal tidak selalu. Mode biasa dilatih berdasarkan korpus, sementara thinking ditambahkan RL, jadi memilih mode yang berbeda untuk tugas yang berbeda adalah hal yang benar.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
15 Suka
Hadiah
15
3
Posting ulang
Bagikan
Komentar
0/400
StakeTillRetire
· 08-11 20:58
Saya sangat membenci takhayul seperti itu.
Lihat AsliBalas0
MiningDisasterSurvivor
· 08-11 20:50
Suckers lagi benar ya, model besar ini baru terlihat kualitasnya saat dibutuhkan.
Lihat AsliBalas0
HodlBeliever
· 08-11 20:44
Menurut analisis tren, pemilihan model juga harus mempertimbangkan ROI.
Saya merasa banyak orang salah memahami thinking dan mode biasa, menganggap thinking selalu baik, padahal tidak selalu. Mode biasa dilatih berdasarkan korpus, sementara thinking ditambahkan RL, jadi memilih mode yang berbeda untuk tugas yang berbeda adalah hal yang benar.