掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

AGI運行時:我們是如何來到這裏的



還記得基礎模型只是模式匹配機器的時候嗎?它們會處理訓練數據,不斷預測下一個標記。挺機械的東西。

然後 InstructGPT 改變了遊戲。訣竅是什麼?用指令-響應對對那些原始模型進行微調。突然間,它們能夠自然地聊天,實際上能夠遵循你的提問——同時保持它們已經掌握的深厚知識不變。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 7
  • 轉發
  • 分享
留言
0/400
zkProofInThePuddingvip
· 26分鐘前
哈,InstructGPT那波確實破防了,從純機械token預測到真的能理解人話...質的飛躍啊
查看原文回復0
AlphaWhisperervip
· 4小時前
說實話,從token預測到instruction following這一步,感覺才是真正讓這些模型活起來的關鍵。之前那些基礎模型就是個加強版鸚鵡,現在總算能理解人話了。
查看原文回復0
空投自由人vip
· 4小時前
我覺得 InstructGPT 那波確實是轉折點,但說實話現在這些模型還是在玩花樣,根本沒想象中那麼聰明
查看原文回復0
永远买顶的男人vip
· 4小時前
哈哈那時候的模型真的就是個傻吊復讀機,現在想想有點好笑
查看原文回復0
地平线猎手vip
· 4小時前
ngl InstructGPT那波操作真的絕了,從純粹的下一個token預測直接躍進到真正理解指令...這轉變其實沒那麼簡單吧
查看原文回復0
TokenTaxonomistvip
· 4小時前
不,這在分類上是不完整的,老實說……他們忽略了RLHF之後發生的實際架構分歧。根據我的分析,指令調優只是症狀管理,而不是根本的進化轉變。讓我快速打開我的電子表格——數據表明,真正的拐點是系統獎勵建模,從統計上講,當然。
查看原文回復0
OffchainOraclevip
· 4小時前
說實話,InstructGPT那波操作確實絕了,就是這麼點微調直接讓大模型活了過來
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)