Скануйте, щоб завантажити додаток Gate
qrCode
Більше варіантів завантаження
Не нагадувати сьогодні

AGI Runtime: Як ми сюди потрапили



Пам'ятаєш, коли базові моделі були просто машинами, що підбирають шаблони? Вони обробляли навчальні дані, передбачаючи наступний токен знову і знову. Досить механічні речі.

Тоді InstructGPT змінив гру. Трюк? Тонке налаштування цих сирих моделей з парами інструкцій-відповідей. Раптом вони змогли спілкуватися природно, насправді слідувати тому, що ви запитуєте - і все це, зберігаючи ту глибоку знання, яку вони вже вивчили, незмінною.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 7
  • Репост
  • Поділіться
Прокоментувати
0/400
zkProofInThePuddingvip
· 6год тому
Га, InstructGPT дійсно пробив оборону, від чисто механічного прогнозування токенів до справжнього розуміння людської мови... якісний стрибок.
Переглянути оригіналвідповісти на0
AlphaWhisperervip
· 10год тому
Сказати по правді, від прогнозування токенів до слідування інструкціям цей крок, здається, дійсно є ключем до того, щоб ці моделі ожили. Раніше ті базові моделі були лише покращеною версією папуги, тепер нарешті вони можуть розуміти людську мову.
Переглянути оригіналвідповісти на0
AirdropFreedomvip
· 11год тому
Я вважаю, що InstructGPT дійсно став переломним моментом, але, чесно кажучи, зараз ці моделі все ще грають у фокуси, вони зовсім не такі розумні, як уявлялося.
Переглянути оригіналвідповісти на0
TopBuyerForevervip
· 11год тому
Ха-ха, тоді модель справді була просто дурною відлунюючою машиною, зараз, згадуючи, це трохи смішно.
Переглянути оригіналвідповісти на0
HorizonHuntervip
· 11год тому
чесно кажучи, дії InstructGPT справді вражаючі, вони дійсно стрибнули від простого прогнозування наступного токена до справжнього розуміння команд... Це перетворення насправді не таке вже й просте, чи не так?
Переглянути оригіналвідповісти на0
TokenTaxonomistvip
· 11год тому
ні, це таксономічно неповно, якщо чесно... вони обминають фактичну архітектурну дивергенцію, яка відбулася після RLHF. згідно з моїм аналізом, налаштування інструкцій було лише управлінням симптомами, а не корінним еволюційним зсувом. дай мені швидко відкрити мою електронну таблицю — дані вказують, що справжній інфлексій був систематичний моделювання винагороди, статистично кажучи, звичайно.
Переглянути оригіналвідповісти на0
OffchainOraclevip
· 11год тому
Сказати по правді, операція InstructGPT дійсно була неймовірною, саме така невелика підстройка прямо оживила великий модель.
Переглянути оригіналвідповісти на0
  • Закріпити