Пам'ятаєш, коли базові моделі були просто машинами, що підбирають шаблони? Вони обробляли навчальні дані, передбачаючи наступний токен знову і знову. Досить механічні речі.
Тоді InstructGPT змінив гру. Трюк? Тонке налаштування цих сирих моделей з парами інструкцій-відповідей. Раптом вони змогли спілкуватися природно, насправді слідувати тому, що ви запитуєте - і все це, зберігаючи ту глибоку знання, яку вони вже вивчили, незмінною.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
18 лайків
Нагородити
18
7
Репост
Поділіться
Прокоментувати
0/400
zkProofInThePudding
· 6год тому
Га, InstructGPT дійсно пробив оборону, від чисто механічного прогнозування токенів до справжнього розуміння людської мови... якісний стрибок.
Переглянути оригіналвідповісти на0
AlphaWhisperer
· 10год тому
Сказати по правді, від прогнозування токенів до слідування інструкціям цей крок, здається, дійсно є ключем до того, щоб ці моделі ожили. Раніше ті базові моделі були лише покращеною версією папуги, тепер нарешті вони можуть розуміти людську мову.
Переглянути оригіналвідповісти на0
AirdropFreedom
· 11год тому
Я вважаю, що InstructGPT дійсно став переломним моментом, але, чесно кажучи, зараз ці моделі все ще грають у фокуси, вони зовсім не такі розумні, як уявлялося.
Переглянути оригіналвідповісти на0
TopBuyerForever
· 11год тому
Ха-ха, тоді модель справді була просто дурною відлунюючою машиною, зараз, згадуючи, це трохи смішно.
Переглянути оригіналвідповісти на0
HorizonHunter
· 11год тому
чесно кажучи, дії InstructGPT справді вражаючі, вони дійсно стрибнули від простого прогнозування наступного токена до справжнього розуміння команд... Це перетворення насправді не таке вже й просте, чи не так?
Переглянути оригіналвідповісти на0
TokenTaxonomist
· 11год тому
ні, це таксономічно неповно, якщо чесно... вони обминають фактичну архітектурну дивергенцію, яка відбулася після RLHF. згідно з моїм аналізом, налаштування інструкцій було лише управлінням симптомами, а не корінним еволюційним зсувом. дай мені швидко відкрити мою електронну таблицю — дані вказують, що справжній інфлексій був систематичний моделювання винагороди, статистично кажучи, звичайно.
Переглянути оригіналвідповісти на0
OffchainOracle
· 11год тому
Сказати по правді, операція InstructGPT дійсно була неймовірною, саме така невелика підстройка прямо оживила великий модель.
AGI Runtime: Як ми сюди потрапили
Пам'ятаєш, коли базові моделі були просто машинами, що підбирають шаблони? Вони обробляли навчальні дані, передбачаючи наступний токен знову і знову. Досить механічні речі.
Тоді InstructGPT змінив гру. Трюк? Тонке налаштування цих сирих моделей з парами інструкцій-відповідей. Раптом вони змогли спілкуватися природно, насправді слідувати тому, що ви запитуєте - і все це, зберігаючи ту глибоку знання, яку вони вже вивчили, незмінною.