O Google DeepMind apresentou o agente de IA SIMA 2 que pode entender instruções, raciocinar e ensinar-se novas habilidades em ambientes virtuais, atingindo um nível de conclusão de tarefas semelhante ao humano.

A divisão de IA da empresa de tecnologia Google, Google DeepMind, apresentou o SIMA 2, a versão mais recente do seu Agente Multi-mundo Escalável e Instruível, marcando um avanço em direção a agentes de IA mais capazes e de propósito geral.
Construído sobre as avançadas capacidades de raciocínio dos modelos Gemini, o sistema expande-se além da simples execução de instruções em ambientes virtuais e agora funciona como um companheiro interativo que pode interpretar objetivos, conversar com os usuários e aprimorar seu desempenho ao longo do tempo.
O primeiro modelo SIMA aprendeu centenas de ações impulsionadas por linguagem em jogos comerciais ao observar a entrada de tela e operar com controles virtuais em vez de mecânicas de jogo integradas.
O SIMA 2 avança esta abordagem ao integrar o Gemini como seu núcleo, permitindo que o agente realize raciocínio orientado a objetivos, explique suas ações pretendidas e execute tarefas mais complexas dentro dos jogos. Treinado com uma combinação de demonstrações humanas e anotações geradas pelo Gemini, o agente foi testado em um conjunto mais amplo de jogos através de parcerias com vários desenvolvedores. Esta atualização representa um passo significativo para a IA incorporada, combinando percepção, raciocínio e ação em ambientes 3D dinâmicos.
A integração do Gemini fortaleceu a capacidade do SIMA 2 de generalizar e operar de forma confiável em contextos desconhecidos. O agente agora pode interpretar instruções mais detalhadas e nuançadas e executá-las com sucesso mesmo em jogos que não encontrou anteriormente, como o título temático viking ASKA ou MineDojo, uma versão de pesquisa do Minecraft.
A sua capacidade de aplicar conceitos aprendidos em diferentes ambientes—por exemplo, estender a ideia de “mineração” de um jogo para “colheita” em outro—constitui um componente chave da generalização ampla e aproxima o seu desempenho do de um jogador humano.
Para avaliar essas capacidades, o SIMA 2 também foi testado em mundos 3D gerados proceduralmente criados pelo Genie 3, que produz novos ambientes a partir de prompts de texto ou imagem. Nesses cenários desconhecidos, o agente ainda foi capaz de navegar efetivamente, interpretar instruções e trabalhar em direção a objetivos definidos pelo usuário, mostrando um nível de adaptabilidade não anteriormente observado em sistemas semelhantes.
SIMA 2 Avanços em IA Autocontrolável com Novas Capacidades em Generalização e Aprendizagem Autónoma
De acordo com a empresa, um dos desenvolvimentos mais notáveis do SIMA 2 é a sua capacidade emergente de melhorar seu próprio desempenho. Durante o treinamento, o agente demonstrou que pode assumir tarefas cada vez mais complexas através de tentativas e erros iterativos combinados com feedback do Gemini. Após aprender inicialmente com demonstrações humanas, o SIMA 2 é capaz de continuar progredindo em novos jogos através de jogo autônomo, adquirindo habilidades em ambientes desconhecidos sem precisar de dados humanos adicionais. Essa experiência pode então ser usada para treinar versões subsequentes, mais capazes, do agente de IA, e o mesmo processo de autoaperfeiçoamento foi aplicado com sucesso em ambientes gerados pelo Genie, marcando um avanço significativo em direção ao treinamento de agentes gerais em mundos sintéticos diversos. Esse ciclo de refinamento contínuo apoia o objetivo de longo prazo de permitir que os agentes aprendam com mínima orientação humana.
A operação do SIMA 2 em uma ampla gama de ambientes de jogos fornece um importante campo de teste para a inteligência geral, permitindo que ela adquira habilidades, pratique o raciocínio e aprenda continuamente por meio de ação autodirigida. Embora o sistema represente um avanço substancial em direção à inteligência geral, interativa e incorporada, ele mantém limitações claras de estágio de pesquisa. O agente continua a enfrentar dificuldades com tarefas complexas e de longo prazo que exigem raciocínio prolongado ou verificação repetida de metas, e sua memória permanece curta devido à necessidade de interação de baixa latência dentro de uma janela de contexto limitada. A precisão em ações detalhadas e a compreensão visual de cenas 3D complexas também permanecem um desafio mais amplo em todo o campo.
O projeto demonstra o potencial de uma abordagem de IA orientada para a ação, na qual uma ampla competência é apoiada por dados de treinamento diversos e fortes capacidades de raciocínio. O SIMA 2 mostra que esses elementos podem ser unificados em um único agente generalista, em vez de isolados em sistemas especializados separados, e oferece um caminho promissor para aplicações futuras em robótica, uma vez que muitas das habilidades aprendidas em ambientes virtuais—como navegação, uso de ferramentas e manuseio colaborativo de tarefas—se traduzem em componentes fundamentais para IA incorporada.
A SIMA 2 é projetada como um agente de pesquisa interativo e centrado no ser humano, e seu desenvolvimento inclui um foco claro em práticas responsáveis, particularmente no que diz respeito a seus mecanismos de autoaperfeiçoamento. A equipe colaborou com especialistas em inovação responsável durante todo o projeto e está lançando a SIMA 2 em uma prévia de pesquisa limitada, proporcionando acesso antecipado a acadêmicos selecionados e desenvolvedores de jogos. Essa abordagem faseada permite uma contínua análise, feedback e avaliação interdisciplinar à medida que a tecnologia e suas potenciais implicações são exploradas.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Google DeepMind Revela SIMA 2: Agente de IA Capaz de Jogar, Raciocinar e Aprender em Mundos Virtuais 3D
Em resumo
O Google DeepMind apresentou o agente de IA SIMA 2 que pode entender instruções, raciocinar e ensinar-se novas habilidades em ambientes virtuais, atingindo um nível de conclusão de tarefas semelhante ao humano.

A divisão de IA da empresa de tecnologia Google, Google DeepMind, apresentou o SIMA 2, a versão mais recente do seu Agente Multi-mundo Escalável e Instruível, marcando um avanço em direção a agentes de IA mais capazes e de propósito geral.
Construído sobre as avançadas capacidades de raciocínio dos modelos Gemini, o sistema expande-se além da simples execução de instruções em ambientes virtuais e agora funciona como um companheiro interativo que pode interpretar objetivos, conversar com os usuários e aprimorar seu desempenho ao longo do tempo.
O primeiro modelo SIMA aprendeu centenas de ações impulsionadas por linguagem em jogos comerciais ao observar a entrada de tela e operar com controles virtuais em vez de mecânicas de jogo integradas.
O SIMA 2 avança esta abordagem ao integrar o Gemini como seu núcleo, permitindo que o agente realize raciocínio orientado a objetivos, explique suas ações pretendidas e execute tarefas mais complexas dentro dos jogos. Treinado com uma combinação de demonstrações humanas e anotações geradas pelo Gemini, o agente foi testado em um conjunto mais amplo de jogos através de parcerias com vários desenvolvedores. Esta atualização representa um passo significativo para a IA incorporada, combinando percepção, raciocínio e ação em ambientes 3D dinâmicos.
A integração do Gemini fortaleceu a capacidade do SIMA 2 de generalizar e operar de forma confiável em contextos desconhecidos. O agente agora pode interpretar instruções mais detalhadas e nuançadas e executá-las com sucesso mesmo em jogos que não encontrou anteriormente, como o título temático viking ASKA ou MineDojo, uma versão de pesquisa do Minecraft.
A sua capacidade de aplicar conceitos aprendidos em diferentes ambientes—por exemplo, estender a ideia de “mineração” de um jogo para “colheita” em outro—constitui um componente chave da generalização ampla e aproxima o seu desempenho do de um jogador humano.
Para avaliar essas capacidades, o SIMA 2 também foi testado em mundos 3D gerados proceduralmente criados pelo Genie 3, que produz novos ambientes a partir de prompts de texto ou imagem. Nesses cenários desconhecidos, o agente ainda foi capaz de navegar efetivamente, interpretar instruções e trabalhar em direção a objetivos definidos pelo usuário, mostrando um nível de adaptabilidade não anteriormente observado em sistemas semelhantes.
SIMA 2 Avanços em IA Autocontrolável com Novas Capacidades em Generalização e Aprendizagem Autónoma
De acordo com a empresa, um dos desenvolvimentos mais notáveis do SIMA 2 é a sua capacidade emergente de melhorar seu próprio desempenho. Durante o treinamento, o agente demonstrou que pode assumir tarefas cada vez mais complexas através de tentativas e erros iterativos combinados com feedback do Gemini. Após aprender inicialmente com demonstrações humanas, o SIMA 2 é capaz de continuar progredindo em novos jogos através de jogo autônomo, adquirindo habilidades em ambientes desconhecidos sem precisar de dados humanos adicionais. Essa experiência pode então ser usada para treinar versões subsequentes, mais capazes, do agente de IA, e o mesmo processo de autoaperfeiçoamento foi aplicado com sucesso em ambientes gerados pelo Genie, marcando um avanço significativo em direção ao treinamento de agentes gerais em mundos sintéticos diversos. Esse ciclo de refinamento contínuo apoia o objetivo de longo prazo de permitir que os agentes aprendam com mínima orientação humana.
A operação do SIMA 2 em uma ampla gama de ambientes de jogos fornece um importante campo de teste para a inteligência geral, permitindo que ela adquira habilidades, pratique o raciocínio e aprenda continuamente por meio de ação autodirigida. Embora o sistema represente um avanço substancial em direção à inteligência geral, interativa e incorporada, ele mantém limitações claras de estágio de pesquisa. O agente continua a enfrentar dificuldades com tarefas complexas e de longo prazo que exigem raciocínio prolongado ou verificação repetida de metas, e sua memória permanece curta devido à necessidade de interação de baixa latência dentro de uma janela de contexto limitada. A precisão em ações detalhadas e a compreensão visual de cenas 3D complexas também permanecem um desafio mais amplo em todo o campo.
O projeto demonstra o potencial de uma abordagem de IA orientada para a ação, na qual uma ampla competência é apoiada por dados de treinamento diversos e fortes capacidades de raciocínio. O SIMA 2 mostra que esses elementos podem ser unificados em um único agente generalista, em vez de isolados em sistemas especializados separados, e oferece um caminho promissor para aplicações futuras em robótica, uma vez que muitas das habilidades aprendidas em ambientes virtuais—como navegação, uso de ferramentas e manuseio colaborativo de tarefas—se traduzem em componentes fundamentais para IA incorporada.
A SIMA 2 é projetada como um agente de pesquisa interativo e centrado no ser humano, e seu desenvolvimento inclui um foco claro em práticas responsáveis, particularmente no que diz respeito a seus mecanismos de autoaperfeiçoamento. A equipe colaborou com especialistas em inovação responsável durante todo o projeto e está lançando a SIMA 2 em uma prévia de pesquisa limitada, proporcionando acesso antecipado a acadêmicos selecionados e desenvolvedores de jogos. Essa abordagem faseada permite uma contínua análise, feedback e avaliação interdisciplinar à medida que a tecnologia e suas potenciais implicações são exploradas.