AGIランタイム：私たちがここに至るまで

ベースモデルが単なるパターンマッチングマシンだった頃を思い出してみてください。彼らはトレーニングデータを処理し、次のトークンを何度も予測していました。かなり機械的なことです。

そしてInstructGPTはゲームを変えました。コツは？指示と応答のペアで生のモデルを微調整することです。突然、彼らは自然に会話をし、実際にあなたの求めていることに従うことができるようになりました - すでに学んだ深い知識をそのまま維持しながら。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

17 いいね

報酬
17
7
リポスト
共有

0/400

zkProofInThePudding

· 1時間前

ハッ、InstructGPTのあの波は確かに防御を突破しましたね。純粋な機械的なトークン予測から本当に人間の言葉を理解できるようになった...質的な飛躍だ。

原文表示返信0

AlphaWhisperer

· 5時間前

正直に言うと、トークン予測から指示に従うステップに至るまでが、これらのモデルを活かす本当の鍵だと感じています。それ以前の基本モデルは強化版のオウムのようなもので、今やようやく人間の言葉を理解できるようになりました。

原文表示返信0

AirdropFreedom

· 5時間前

私はInstructGPTが確かに転機だったと思いますが、正直言って今のこれらのモデルはまだ遊びのようなもので、思ったほどサトシではありません。

原文表示返信0

TopBuyerForever

· 5時間前

ハハ、その時のモデルは本当にバカなリピートマシンでしたが、今考えると少し面白いですね。

原文表示返信0

HorizonHunter

· 6時間前

ngl InstructGPTのその操作は本当に素晴らしかった。単なる次のトークンの予測から、実際の命令の理解へと飛躍した...この変化は実際にはそれほど簡単ではないでしょう。

原文表示返信0

TokenTaxonomist

· 6時間前

いや、これは系統的に不完全だと思う... 彼らはRLHF後に起こった実際のアーキテクチャの分岐を軽視している。私の分析によれば、指示調整はただの症状管理であり、根本的な進化の変化ではなかった。ちょっとスプレッドシートを引き出させて—データは、統計的に言えば、実際の変曲点は体系的報酬モデルであったことを示唆している。

原文表示返信0

OffchainOracle

· 6時間前

正直なところ、InstructGPTのあの操作は本当にすごかった。ほんの少しの調整で大きなモデルが生き返ったようだ。

原文表示返信0

人気の話題もっと見る
#TopGainersInADownMarket
5.98K 人気度
#FOMCMeetingMinutesComingUp
4.96K 人気度
#BitcoinPriceWatch
4.7K 人気度
#GovShutdownOfficiallyEnded
30.83K 人気度
#BuyTheDipOrWaitNow?
17.17K 人気度

人気の Gate Funもっと見る

1
G青蛙GFROG
時価総額:$3.86K保有者数:2
0.08%
2
GG
時価総額:$3.79K保有者数:1
0.00%
3
ANTIANTI-Rug Community
時価総額:$3.86K保有者数:2
0.04%
4
ewwert
時価総額:$3.8K保有者数:1
0.00%
5
FnGFear n Greed Index
時価総額:$3.87K保有者数:2
0.22%

ピン

サイトマップ