Chứng khoán Trung Quốc: Đến năm 2026, các mô hình lớn sẽ đạt được nhiều đột phá hơn trong lĩnh vực học tăng cường, ghi nhớ mô hình, kỹ thuật ngữ cảnh và các lĩnh vực khác

CryptocurrencySniper · 2026-02-05T01:30:19+00:00

Trung Kim nghiên cứu chỉ ra rằng, nhìn lại năm 2025, công nghệ mô hình lớn toàn cầu dần tiến bộ, học tăng cường, ghi nhớ mô hình và các lĩnh vực khác dự kiến sẽ đạt đột phá vào năm 2026, nhưng mô hình vẫn còn những hạn chế về độ ổn định và tỷ lệ ảo tưởng. Đồng thời, kỳ vọng thế hệ mới của các chip hiệu suất cao sẽ giúp nâng cao trí thông minh và số lượng tham số của mô hình.

CryptocurrencySniper

2026-02-05 01:30:19

Đang tạo bản tóm tắt

CICC chỉ ra rằng nhìn lại năm 2025, năng lực kỹ thuật của các mô hình lớn toàn cầu sẽ phát triển về phía trước, từng bước vượt qua các kịch bản năng suất và có những tiến bộ đáng kể theo hướng suy luận, lập trình, năng lực tác nhân và đa phương thức, nhưng vẫn còn những bất cập về khả năng chung của mô hình về độ ổn định và tỷ lệ ảo giác. Hướng tới năm 2026, CICC tin rằng các mô hình lớn sẽ tạo ra nhiều đột phá hơn trong học tăng cường, trí nhớ mô hình, kỹ thuật ngữ cảnh, v.v., từ tạo ngữ cảnh ngắn đến chuỗi nhiệm vụ tư duy dài, từ tương tác văn bản đến đa phương thức gốc và tiến một bước gần hơn đến việc đạt được mục tiêu dài hạn của AGI.

Toàn văn dưới đây

CICC | Triển vọng 10 năm AI (26): Công nghệ mô hình cho các xu hướng chính vào năm 2026

Nghiên cứu CICC

Nhìn lại năm 2025, năng lực kỹ thuật của các mô hình lớn toàn cầu sẽ phát triển về phía trước, từng bước vượt qua các kịch bản năng suất và có những tiến bộ đáng kể theo hướng khả năng suy luận, lập trình, tác nhân và đa phương thức, nhưng vẫn còn những bất cập về độ ổn định, tỷ lệ ảo giác, v.v. Hướng tới năm 2026, chúng tôi tin rằng các mô hình lớn sẽ tạo ra nhiều đột phá hơn trong học tăng cường, bộ nhớ mô hình, kỹ thuật ngữ cảnh, v.v., từ tạo ngữ cảnh ngắn đến các tác vụ chuỗi suy nghĩ dài, từ tương tác văn bản đến đa phương thức gốc và tiến một bước gần hơn đến việc đạt được mục tiêu dài hạn của AGI.

Tóm tắt

Chúng tôi hy vọng Luật tỷ lệ trước khi đào tạo sẽ xuất hiện trở lại vào năm 2026 và số lượng thông số của mô hình hàng đầu sẽ được đưa lên cấp độ cao hơn. Về kiến trúc, kiến trúc mô hình dựa trên Transformer vẫn tiếp tục, và Bộ Xây dựng cân bằng giữa hiệu suất và hiệu quả đã trở thành sự đồng thuận, và các tuyến cơ chế chú ý khác nhau vẫn đang được tối ưu hóa và chuyển đổi. Về mô hình, Scaling-Law + dữ liệu chất lượng cao + học tăng cường trong giai đoạn tiền đào tạo sẽ cùng nhau cải thiện khả năng của mô hình. Một trong những kỳ vọng cho năm 2026 là với sự trưởng thành và quảng bá của chip dòng GB của NVIDIA, mô hình sẽ dựa trên cụm Wanka hiệu suất cao hơn trong giai đoạn tiền đào tạo của Scaling-Law, và số lượng thông số mô hình và giới hạn trên của trí thông minh sẽ được cải thiện hơn nữa.

Tầm quan trọng của học tăng cường đã tăng lên và trở thành chìa khóa để mở khóa các khả năng nâng cao của các mô hình. Sự ra đời của học tăng cường nâng cao giới hạn trên của trí thông minh của mô hình, cho phép mô hình suy nghĩ và suy luận logic hơn và phù hợp với sở thích của con người, và bản chất của nó là “dữ liệu tự tạo + nhiều vòng lặp lại”, và chìa khóa của học tăng cường nằm ở sức mạnh tính toán quy mô lớn + dữ liệu chất lượng cao. Các nhà sản xuất mô hình ở nước ngoài như OpenAI và Gemini rất coi trọng việc học tăng cường, DeepSeek và Alibaba Qianwen trong nước cũng đang làm theo, và chúng tôi hy vọng rằng tỷ lệ học tăng cường của các nhà sản xuất mô hình trong và ngoài nước sẽ tăng hơn nữa vào năm 2026.

Các lộ trình mới như học tập liên tục, trí nhớ mô hình và mô hình thế giới sẽ mở ra những đột phá cốt lõi. Học liên tục và bộ nhớ mô hình về cơ bản giải quyết vấn đề “quên thảm khốc” của các mô hình lớn, cho phép mô hình có cơ chế bộ nhớ chọn lọc. Cốt lõi của các thuật toán và kiến trúc của Google, chẳng hạn như Titans, MIRAS và Nested Learning, là một cách để các mô hình tự động điều chỉnh việc học và trí nhớ dựa trên khoảng thời gian và tầm quan trọng của nhiệm vụ, từ đó đạt được khả năng học tập liên tục và thậm chí học tập suốt đời. Ngoài ra, các mô hình thế giới tập trung vào việc hiểu các quy luật nhân quả của thế giới vật chất có cơ hội đột phá dưới sự khám phá các con đường mô hình khác nhau như Genie 3 và Marble.

Rủi ro

lặp lại công nghệ không đạt được kỳ vọng; Các kiến trúc mô hình và mô hình đào tạo hiện có bị gián đoạn.

(Nguồn bài viết: Báo Tài chính Nhân dân)

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.