Còn nhớ khi các mô hình cơ bản chỉ là những cỗ máy khớp mẫu? Chúng sẽ xử lý dữ liệu huấn luyện, dự đoán token tiếp theo liên tục. Thật là những thứ rất cơ giới.
Sau đó, InstructGPT đã thay đổi cục diện. Mẹo? Tinh chỉnh những mô hình thô đó với các cặp hướng dẫn-phản hồi. Đột nhiên, chúng có thể trò chuyện tự nhiên, thực sự theo dõi những gì bạn đang hỏi - tất cả trong khi giữ nguyên kiến thức sâu sắc mà chúng đã học được.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
18 thích
Phần thưởng
18
7
Đăng lại
Retweed
Bình luận
0/400
zkProofInThePudding
· 6giờ trước
Ha, InstructGPT thực sự đã phá vỡ phòng thủ, từ việc dự đoán token một cách thuần túy đến việc thực sự hiểu được ngôn ngữ của con người... một bước nhảy vọt chất lượng.
Xem bản gốcTrả lời0
AlphaWhisperer
· 11giờ trước
Nói thật, từ dự đoán token đến việc theo dõi hướng dẫn, tôi cảm thấy đây mới thực sự là chìa khóa giúp những mô hình này hoạt động. Những mô hình cơ bản trước đây chỉ là một phiên bản nâng cấp của con vẹt, giờ cuối cùng cũng có thể hiểu được ngôn ngữ con người.
Xem bản gốcTrả lời0
AirdropFreedom
· 11giờ trước
Tôi nghĩ rằng InstructGPT thực sự là một bước ngoặt, nhưng nói thật là bây giờ những mô hình này vẫn chỉ đang chơi trò vui, không thông minh như đã tưởng tượng.
Xem bản gốcTrả lời0
TopBuyerForever
· 11giờ trước
Haha, lúc đó mô hình thực sự chỉ là một cái máy phát lại ngốc nghếch, bây giờ nghĩ lại thấy hơi buồn cười.
Xem bản gốcTrả lời0
HorizonHunter
· 11giờ trước
ngl InstructGPT thật sự là một cú sốc, từ việc dự đoán token tiếp theo một cách thuần túy đã nhảy vọt đến việc hiểu lệnh thực sự... sự chuyển biến này thực sự không đơn giản như vậy đúng không?
Xem bản gốcTrả lời0
TokenTaxonomist
· 11giờ trước
không, điều này thực sự là chưa đầy đủ về phân loại... họ đang lướt qua sự khác biệt kiến trúc thực sự đã xảy ra sau RLHF. theo phân tích của tôi, việc tinh chỉnh hướng dẫn chỉ là quản lý triệu chứng, không phải là sự thay đổi tiến hóa gốc. để tôi lấy bảng tính của mình nhanh một chút—dữ liệu cho thấy sự chuyển mình thực sự là mô hình hóa phần thưởng hệ thống, nói về mặt thống kê thì tất nhiên.
Xem bản gốcTrả lời0
OffchainOracle
· 11giờ trước
Nói thật, thao tác của InstructGPT thực sự tuyệt vời, chỉ với một chút điều chỉnh như vậy đã khiến mô hình lớn trở nên sống động.
Runtime AGI: Chúng tôi đã đến đây như thế nào
Còn nhớ khi các mô hình cơ bản chỉ là những cỗ máy khớp mẫu? Chúng sẽ xử lý dữ liệu huấn luyện, dự đoán token tiếp theo liên tục. Thật là những thứ rất cơ giới.
Sau đó, InstructGPT đã thay đổi cục diện. Mẹo? Tinh chỉnh những mô hình thô đó với các cặp hướng dẫn-phản hồi. Đột nhiên, chúng có thể trò chuyện tự nhiên, thực sự theo dõi những gì bạn đang hỏi - tất cả trong khi giữ nguyên kiến thức sâu sắc mà chúng đã học được.