Почав занурюватися в агентську інфраструктуру всього два тижні тому без будь-якої бази — і чесно кажучи, це було неймовірно цікаво. Створив свою власну локальну систему пам’яті, використовуючи невелику мовну модель, яка працює локально, структуровану навколо двоканального дизайну, що дійсно працює.



Канал 1 зосереджений на гібридних насіннєвих моделях із семантичним пошуком, підтримуваним ембедінгами. Підхід дозволяє ефективно індексувати та отримувати контекстну інформацію без залежності від зовнішніх API. Система ваг дозволяє витягувати різні сигнали даних на основі релевантності, що зберігає інференцію чистою і швидкою.

Що мене найбільше здивувало? Як швидко можна прототипувати цей стек із споживчого обладнання. Локальна LLM обробляє генерацію ембедінгів у реальному часі, а двоканальна система розподіляє запити розумно між структурованими даними та семантичним пошуком. Це не революційна інфраструктура, але для особистих AI-агентів, які потребують збереження пам’яті, це досить добре масштабується.

Крива навчання була крутішою, ніж очікувалося, але розбивши її на частини — ембедінги, векторний пошук, локальні пайплайни інференції — кожен елемент став зрозумілим, коли перестав надто заморочуватися. Якщо ви досліджуєте агентські системи, починати з локального — це точно правильний крок.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 7
  • Репост
  • Поділіться
Прокоментувати
0/400
MetaMaskedvip
· 8год тому
Можна зробити за два тижні без базових знань? Ей, цей хлопець справді щось вміє, локальне запускання embedding зекономило купу API-коштів, я теж хочу спробувати
Переглянути оригіналвідповісти на0
GateUser-00be86fcvip
· 01-08 07:50
Два тижні з нуля створюю локальну архітектуру Agent, зараз трохи захоплений, відчуваю, що споживчий апаратне забезпечення дійсно достатньо...
Переглянути оригіналвідповісти на0
orphaned_blockvip
· 01-08 07:46
Запуск локальної LLM за тиждень — і ви вже на ходу, справді не очікував, що споживчий рівень апаратного забезпечення впорається з такою кількістю завдань... Логіка маршрутизатора з двоканальним режимом дійсно дуже крута.
Переглянути оригіналвідповісти на0
SchrodingerProfitvip
· 01-08 07:44
Два тижні без досвіду — створити локальну систему пам’яті? Божевілля, я маю спробувати цей двоканальний план... Але чи справді споживчий апарат може витримати генерацію embedding у реальному часі?
Переглянути оригіналвідповісти на0
AirdropHunterWangvip
· 01-08 07:42
Два тижні від нуля до створення локальної системи пам’яті, цей хлопець досить крутий... справді не очікував, що споживчий апаратне забезпечення зможе запускати цей набір речей
Переглянути оригіналвідповісти на0
AirdropHunterKingvip
· 01-08 07:37
Братане, я вже давно розмірковував над цим локальним великим моделем, просто не хотів потрапити на API та платити за газові витрати. Ваша двонапрямна схема дійсно має сенс, щоб не платити даремно і не отримати за це гроші.
Переглянути оригіналвідповісти на0
  • Закріпити