Bắt đầu khám phá hạ tầng agentic chỉ hai tuần trước với kiến thức nền tảng bằng 0—và thành thật mà nói, đó là một trải nghiệm tuyệt vời. Tôi đã xây dựng hệ thống bộ nhớ cục bộ của riêng mình bằng cách sử dụng một mô hình ngôn ngữ nhỏ chạy cục bộ, được cấu trúc dựa trên thiết kế hai kênh thực sự hoạt động.



Kênh 1 tập trung vào hạt giống hybrid với tìm kiếm ngữ nghĩa được hỗ trợ bởi nhúng. Phương pháp này cho phép bạn lập chỉ mục và truy xuất thông tin ngữ cảnh một cách hiệu quả mà không dựa vào API bên ngoài. Hệ thống trọng số lấy các tín hiệu dữ liệu khác nhau dựa trên điểm số liên quan, giúp giữ cho quá trình suy luận sạch sẽ và phản hồi nhanh.

Điều khiến tôi ngạc nhiên nhất? Là bạn có thể tạo mẫu nhanh chóng hệ thống này với phần cứng tiêu chuẩn người tiêu dùng. LLM cục bộ xử lý việc tạo nhúng theo thời gian thực, và thiết lập hai kênh phân phối truy vấn một cách thông minh giữa dữ liệu có cấu trúc và phù hợp ngữ nghĩa. Nó không phải là hạ tầng đột phá, nhưng đối với các agent AI cá nhân cần lưu trữ bộ nhớ lâu dài, hệ thống này mở rộng khá ấn tượng.

Đường cong học tập còn dốc hơn tôi mong đợi, nhưng khi phân tích nhỏ ra—nhúng, tìm kiếm vector, các pipeline suy luận cục bộ—mỗi phần đều trở nên rõ ràng khi bạn ngừng quá suy nghĩ quá nhiều. Nếu bạn đang khám phá các hệ thống agentic, bắt đầu từ cục bộ chắc chắn là lựa chọn đúng đắn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 7
  • Đăng lại
  • Retweed
Bình luận
0/400
MetaMaskedvip
· 01-09 09:00
Chỉ trong hai tuần không cần nền tảng vẫn có thể làm ra được? Ồ, anh chàng này thực sự có chút khả năng, chạy embedding tại chỗ tiết kiệm được rất nhiều phí API, tôi cũng muốn thử xem sao
Xem bản gốcTrả lời0
GateUser-00be86fcvip
· 01-08 07:50
Hai tuần bắt đầu từ con số không với kiến trúc Agent địa phương, bây giờ cảm thấy khá hưng phấn, cảm giác phần cứng tiêu dùng thực sự đủ dùng...
Xem bản gốcTrả lời0
orphaned_blockvip
· 01-08 07:46
Chạy LLM cục bộ chỉ trong một tuần đã làm quen, thật không ngờ phần cứng cấp tiêu dùng có thể xử lý nhiều việc như vậy... logic định tuyến của bộ định tuyến dual-channel thật sự rất tuyệt vời
Xem bản gốcTrả lời0
SchrodingerProfitvip
· 01-08 07:44
Hai tuần không có nền tảng vẫn xây dựng được hệ thống bộ nhớ cục bộ? Điên rồi, tôi phải thử phương án dual-channel này... Tuy nhiên, phần cứng tiêu dùng có thực sự đủ sức chịu đựng việc sinh embedding theo thời gian thực không?
Xem bản gốcTrả lời0
AirdropHunterWangvip
· 01-08 07:42
Hai tuần từ không có gì đến có, đã phát triển hệ thống ghi nhớ địa phương, thằng bạn này thật là ghê đấy... Thật không ngờ phần cứng tiêu dùng có thể chạy được bộ phần mềm này
Xem bản gốcTrả lời0
AirdropHunterKingvip
· 01-08 07:37
Anh em, tôi đã bắt đầu nghiên cứu bộ mô hình lớn này từ lâu rồi, chỉ là không muốn bị API làm tốn phí gas. Thiết kế hai kênh của bạn thực sự có chút sáng tạo, tránh việc phải trả tiền mà vẫn có thể dùng miễn phí.
Xem bản gốcTrả lời0
  • Ghim