Gateアプリをダウンロードするにはスキャンしてください
qrCode
その他のダウンロードオプション
今日はこれ以上表示しない

AGIランタイム:私たちがここに至るまで



ベースモデルが単なるパターンマッチングマシンだった頃を思い出してみてください。彼らはトレーニングデータを処理し、次のトークンを何度も予測していました。かなり機械的なことです。

そしてInstructGPTはゲームを変えました。コツは?指示と応答のペアで生のモデルを微調整することです。突然、彼らは自然に会話をし、実際にあなたの求めていることに従うことができるようになりました - すでに学んだ深い知識をそのまま維持しながら。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 7
  • リポスト
  • 共有
コメント
0/400
zkProofInThePuddingvip
· 1時間前
ハッ、InstructGPTのあの波は確かに防御を突破しましたね。純粋な機械的なトークン予測から本当に人間の言葉を理解できるようになった...質的な飛躍だ。
原文表示返信0
AlphaWhisperervip
· 5時間前
正直に言うと、トークン予測から指示に従うステップに至るまでが、これらのモデルを活かす本当の鍵だと感じています。それ以前の基本モデルは強化版のオウムのようなもので、今やようやく人間の言葉を理解できるようになりました。
原文表示返信0
AirdropFreedomvip
· 5時間前
私はInstructGPTが確かに転機だったと思いますが、正直言って今のこれらのモデルはまだ遊びのようなもので、思ったほどサトシではありません。
原文表示返信0
TopBuyerForevervip
· 5時間前
ハハ、その時のモデルは本当にバカなリピートマシンでしたが、今考えると少し面白いですね。
原文表示返信0
HorizonHuntervip
· 6時間前
ngl InstructGPTのその操作は本当に素晴らしかった。単なる次のトークンの予測から、実際の命令の理解へと飛躍した...この変化は実際にはそれほど簡単ではないでしょう。
原文表示返信0
TokenTaxonomistvip
· 6時間前
いや、これは系統的に不完全だと思う... 彼らはRLHF後に起こった実際のアーキテクチャの分岐を軽視している。私の分析によれば、指示調整はただの症状管理であり、根本的な進化の変化ではなかった。ちょっとスプレッドシートを引き出させて—データは、統計的に言えば、実際の変曲点は体系的報酬モデルであったことを示唆している。
原文表示返信0
OffchainOraclevip
· 6時間前
正直なところ、InstructGPTのあの操作は本当にすごかった。ほんの少しの調整で大きなモデルが生き返ったようだ。
原文表示返信0
  • ピン