Os resultados do desempenho excepcional do Gemini 3 Flash no modelo OpenClaw foram partilhados

robot
Geração do resumo em andamento

Os fundadores do OpenClaw, Peter Steinberger, compartilharam recentemente notícias importantes que se tornaram o centro das atenções na indústria de IA. Eles divulgaram informações detalhadas sobre o desempenho do seu sistema de IA através de uma entidade independente de terceiros, a PinchBench.

Resultados apresentados pela PinchBench

De acordo com o relatório da 1M AI News, a PinchBench é uma organização independente que analisa o desempenho de vários grandes modelos de linguagem (LLMs). Nesta última avaliação, foi comparado o desempenho de todos os principais modelos de IA envolvidos nas tarefas do agente OpenClaw.

Os resultados partilhados pela PinchBench são bastante encorajadores. Na avaliação, o Gemini 3 Flash, um dos modelos mais recentes do Google, obteve uma taxa de sucesso de 95,1% e ficou em primeiro lugar.

Diferenças de desempenho entre os modelos

Em segundo lugar, está o modelo minimax-m2.1, desenvolvido pela Minimax, que alcançou uma taxa de sucesso de 93,6%. Em terceiro lugar, ficou o modelo kimi-k2.5 da Moonshot AI, com uma taxa de sucesso de 93,4%.

O desempenho de outros modelos conhecidos também é digno de nota. O modelo Claude Sonnet 4.5 da Anthropic obteve uma taxa de sucesso de 92,7%, ficando em quarto lugar. O modelo GPT-4o da OpenAI, bastante popular, ficou em quinto lugar com uma taxa de 85,2%.

Estes resultados demonstram que ainda há bastante espaço para melhorias nos diferentes modelos de IA em tarefas específicas, e que cada modelo possui suas próprias forças para alcançar os objetivos do OpenClaw.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar