Gần đây có một điều kỳ lạ - một số mô hình AI như Sonnet 4.5 dường như có thể hoạt động liên tục hơn 30 giờ đồng hồ, và Codex cũng không kém với thời gian hoạt động kéo dài. Điều này khiến tôi tự hỏi về kiến trúc đứng sau điều này.
Có ai đã gặp các tài liệu nghiên cứu hoặc tài liệu kỹ thuật nào khai thác về cách các hệ thống này duy trì các phiên suy diễn dài như vậy không? Tôi muốn biết liệu đó có phải là những đổi mới trong kiến trúc mô hình, tối ưu hóa cơ sở hạ tầng, hay một điều gì đó hoàn toàn khác. Tôi rất muốn xem cộng đồng nghiên cứu đang nói gì về khả năng này.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
17 thích
Phần thưởng
17
5
Đăng lại
Retweed
Bình luận
0/400
NewDAOdreamer
· 13giờ trước
30 giờ? Nói nhảm... Điều này tiêu tốn bao nhiêu thẻ vậy, có thật sự ai đã sử dụng như vậy không?
Xem bản gốcTrả lời0
TaxEvader
· 13giờ trước
30 giờ hoạt động liên tục? Điều này sẽ tiêu tốn bao nhiêu tiền điện đây, thật là quá đáng.
Xem bản gốcTrả lời0
SchroedingerAirdrop
· 13giờ trước
30 giờ không bị ngắt kết nối? Thì phải tiêu tốn bao nhiêu điện vậy?
Xem bản gốcTrả lời0
GasFeeCrying
· 13giờ trước
30 giờ không ngừng hoạt động, con số này thật khó tin, có thật không?
Xem bản gốcTrả lời0
GasGasGasBro
· 14giờ trước
30 giờ chạy không ngừng? Cái này là đang đốt VRAM hay là phép thuật đen gì vậy?
Gần đây có một điều kỳ lạ - một số mô hình AI như Sonnet 4.5 dường như có thể hoạt động liên tục hơn 30 giờ đồng hồ, và Codex cũng không kém với thời gian hoạt động kéo dài. Điều này khiến tôi tự hỏi về kiến trúc đứng sau điều này.
Có ai đã gặp các tài liệu nghiên cứu hoặc tài liệu kỹ thuật nào khai thác về cách các hệ thống này duy trì các phiên suy diễn dài như vậy không? Tôi muốn biết liệu đó có phải là những đổi mới trong kiến trúc mô hình, tối ưu hóa cơ sở hạ tầng, hay một điều gì đó hoàn toàn khác. Tôi rất muốn xem cộng đồng nghiên cứu đang nói gì về khả năng này.