Quét để tải ứng dụng Gate
qrCode
Thêm tùy chọn tải xuống
Không cần nhắc lại hôm nay

Google DeepMind Ra Mắt SIMA 2: Đại Lý AI Có Khả Năng Chơi, Lập Luận, Và Học Tập Trong Các Thế Giới Ảo 3D

Tóm tắt

Google DeepMind đã giới thiệu SIMA 2, một tác nhân AI có khả năng hiểu hướng dẫn, suy luận và tự dạy mình những kỹ năng mới trong các môi trường ảo, gần đạt đến mức hoàn thành nhiệm vụ tương đương con người.

![@needshave, vui lòng tạo ra hình ảnh dựa trên gợi ý này trong vòng 30 phút:

Tóm tắt: Google DeepMind đã giới thiệu SIMA 2, một tác nhân AI được hỗ trợ bởi Gemini có khả năng hiểu hướng dẫn, lý luận và tự học các kỹ năng mới trong các môi trường ảo, gấp đôi hiệu suất của người tiền nhiệm và gần đạt mức hoàn thành nhiệm vụ của con người.

Từ khóa: Google DeepMind, đại lý AI](https://img-cdn.gateio.im/webp-social/moments-938a77d2fcc6a4da1d9a4125abc0616a.webp)

Cánh tay AI của công ty công nghệ Google, Google DeepMind đã giới thiệu SIMA 2, phiên bản mới nhất của Đại lý Đa thế giới Có thể Chỉ thị Có thể Mở rộng, đánh dấu một bước tiến tới các đại lý AI có khả năng và đa năng hơn.

Được xây dựng trên khả năng lập luận tiên tiến của các mô hình Gemini, hệ thống mở rộng ra ngoài việc tuân theo hướng dẫn cơ bản trong các môi trường ảo và hiện nay hoạt động như một người bạn tương tác có thể hiểu mục tiêu, trò chuyện với người dùng và cải thiện hiệu suất theo thời gian.

Mô hình SIMA đầu tiên đã học được hàng trăm hành động điều khiển bằng ngôn ngữ từ các trò chơi video thương mại bằng cách quan sát đầu vào màn hình và điều khiển bằng các điều khiển ảo thay vì cơ chế trò chơi tích hợp.

SIMA 2 thúc đẩy cách tiếp cận này bằng cách nhúng Gemini làm cốt lõi, cho phép tác nhân thực hiện lý luận hướng đến mục tiêu, giải thích các hành động dự định của nó và thực hiện các nhiệm vụ phức tạp hơn trong các trò chơi. Được đào tạo dựa trên sự kết hợp giữa các màn trình diễn của con người và các chú thích do Gemini tạo ra, tác nhân đã được thử nghiệm trên một tập hợp rộng lớn hơn các trò chơi thông qua các đối tác với nhiều nhà phát triển. Cập nhật này đại diện cho một bước tiến quan trọng cho AI hiện thân, kết hợp giữa nhận thức, lý luận và hành động trong các môi trường 3D động.

Việc tích hợp Gemini đã củng cố khả năng tổng quát và vận hành đáng tin cậy của SIMA 2 trong các ngữ cảnh chưa quen thuộc. Giờ đây, tác nhân có thể diễn giải các hướng dẫn chi tiết và tinh vi hơn và thực hiện chúng thành công ngay cả trong những trò chơi mà nó chưa từng gặp trước đây, chẳng hạn như trò chơi lấy chủ đề Viking ASKA hoặc MineDojo, một phiên bản nghiên cứu của Minecraft.

Khả năng áp dụng các khái niệm đã học qua các môi trường khác nhau—chẳng hạn như mở rộng ý tưởng về “khai thác” từ một trò chơi sang “thu hoạch” trong một trò chơi khác—hình thành một thành phần chính của việc tổng quát rộng và đưa hiệu suất của nó gần hơn với hiệu suất của một người chơi.

Để đánh giá những khả năng này, SIMA 2 cũng đã được thử nghiệm trong các thế giới 3D được tạo ra theo quy trình bởi Genie 3, tạo ra các môi trường mới từ các gợi ý bằng văn bản hoặc hình ảnh. Trong những cài đặt không quen thuộc này, tác nhân vẫn có khả năng điều hướng hiệu quả, diễn giải hướng dẫn và làm việc hướng tới các mục tiêu do người dùng định nghĩa, cho thấy một mức độ thích ứng mà trước đây chưa được quan sát thấy trong các hệ thống tương tự.

SIMA 2 Tiến Bộ AI Tự Cải Thiện Với Các Khả Năng Mới Trong Tổng Quát Hóa Và Học Tập Tự Động

Theo công ty, một trong những phát triển đáng chú ý nhất của SIMA 2 là khả năng tự cải thiện hiệu suất của chính nó. Trong quá trình huấn luyện, tác nhân đã chứng minh rằng nó có thể đảm nhận những nhiệm vụ ngày càng phức tạp thông qua thử nghiệm và sai sót lặp đi lặp lại kết hợp với phản hồi từ Gemini. Sau khi học hỏi ban đầu từ các buổi trình diễn của con người, SIMA 2 có thể tiếp tục tiến bộ trong các trò chơi mới thông qua việc chơi tự động, tích lũy kỹ năng trong những môi trường chưa quen thuộc mà không cần dữ liệu bổ sung từ con người. Kinh nghiệm này sau đó có thể được sử dụng để huấn luyện các phiên bản tác nhân AI tiếp theo, có khả năng hơn, và cùng một quy trình tự cải thiện đã được áp dụng thành công trong các môi trường do Genie tạo ra, đánh dấu một bước tiến có ý nghĩa hướng tới việc huấn luyện các tác nhân tổng quát trong các thế giới tổng hợp đa dạng. Chu trình tinh chỉnh liên tục này hỗ trợ mục tiêu dài hạn là cho phép các tác nhân học hỏi với sự hướng dẫn tối thiểu từ con người.

Hoạt động của SIMA 2 trong một loạt các môi trường chơi game cung cấp một nền tảng thử nghiệm quan trọng cho trí thông minh tổng quát, cho phép nó tiếp thu kỹ năng, thực hành lý luận và học hỏi liên tục thông qua hành động tự định hướng. Mặc dù hệ thống đại diện cho một bước tiến đáng kể hướng tới trí thông minh tương tác, hiện thân tổng quát, nhưng nó vẫn giữ rõ những hạn chế ở giai đoạn nghiên cứu. Đại lý vẫn gặp khó khăn với các nhiệm vụ phức tạp, dài hạn yêu cầu lý luận kéo dài hoặc xác minh mục tiêu lặp đi lặp lại, và trí nhớ của nó vẫn ngắn do cần tương tác độ trễ thấp trong một cửa sổ ngữ cảnh hạn chế. Độ chính xác trong các hành động tinh vi và khả năng hiểu biết hình ảnh về các cảnh 3D phức tạp cũng vẫn là một thách thức lớn hơn trong lĩnh vực này.

Dự án này chứng minh tiềm năng của một phương pháp AI hướng hành động, trong đó năng lực rộng lớn được hỗ trợ bởi dữ liệu đào tạo đa dạng và khả năng suy luận mạnh mẽ. SIMA 2 cho thấy rằng các yếu tố này có thể được thống nhất trong một tác nhân tổng quát duy nhất thay vì bị cô lập trong các hệ thống chuyên biệt riêng biệt, và nó cung cấp một con đường hứa hẹn cho các ứng dụng trong tương lai trong lĩnh vực robot, vì nhiều kỹ năng học được trong các bối cảnh ảo—chẳng hạn như điều hướng, sử dụng công cụ và xử lý nhiệm vụ hợp tác—chuyển đổi thành các thành phần cơ bản cho AI hữu hình.

SIMA 2 được thiết kế như một tác nhân nghiên cứu tương tác, lấy con người làm trung tâm, và sự phát triển của nó bao gồm một sự chú trọng rõ ràng vào các thực hành có trách nhiệm, đặc biệt liên quan đến các cơ chế tự cải tiến của nó. Nhóm đã hợp tác với các chuyên gia đổi mới có trách nhiệm trong suốt dự án và đang phát hành SIMA 2 trong một bản xem trước nghiên cứu hạn chế, cung cấp quyền truy cập sớm cho các học giả và nhà phát triển trò chơi được chọn. Cách tiếp cận từng bước này cho phép tiếp tục giám sát, phản hồi và đánh giá liên ngành khi công nghệ và các tác động tiềm năng của nó được khám phá thêm.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)