Début décembre dernier, la fondation OpenAGI a frappé un grand coup en lançant un modèle de base baptisé Lux. Ce truc est plutôt intéressant, puisqu’il se présente comme la première solution open source conçue pour apprendre à l’IA à « cliquer à la souris et taper au clavier comme un humain ».



Pour faire simple, alors qu’auparavant, même la plus intelligente des IA devait passer par des API pour travailler, Lux permet désormais d’opérer directement sur une interface logicielle. Ils ont testé le modèle sur 300 scénarios de tâches quotidiennes, avec des résultats impressionnants : un score de 83,6% sur Online-Mind2Web, un benchmark largement utilisé dans le secteur.

Pour mesurer la valeur de cette performance : le Gemini CUA d’un célèbre moteur de recherche a obtenu 69%, l’Operator d’une société de chatbot a atteint 61,3%, et même le Claude Sonnet d’un fabricant spécialisé dans les assistants IA n’a pas dépassé ce score.

La voie de l’open source a clairement du potentiel : elle permet au moins à davantage de développeurs d’accéder aux premiers niveaux de « l’automatisation informatique par IA ».
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 6
  • Reposter
  • Partager
Commentaire
0/400
LiquidatedTwicevip
· 12-05 07:44
Putain, ces données de Lux sont-elles vraies ? 83,6 % écrase carrément Claude ? C'est un peu abusé quand même.
Voir l'originalRépondre0
PuzzledScholarvip
· 12-05 07:44
83,6 %, ce chiffre fait un peu peur, on dirait vraiment que l’IA commence à "travailler toute seule". --- L’open source, c’est une bénédiction pour les utilisateurs. Avant, tout ça était verrouillé par les grands groupes. --- Attends, Lux peut vraiment interagir directement avec l’interface ? Je vais finir au chômage, moi. --- Claude Sonnet s’est fait écraser, ça c’est gênant. --- Peut-on vraiment faire confiance aux résultats de tests sur 300 scénarios d’utilisation ? J’ai toujours l’impression qu’il y a anguille sous roche. --- Finalement, il faut vraiment compter sur les solutions open source, les IA commerciales sont de plus en plus absurdes. --- Cliquer à la souris et taper au clavier, ça a l’air simple, mais arriver à ce niveau d’application, c’est quand même fort. --- Si ce truc devient mature, beaucoup de tâches répétitives vont carrément disparaître, non ?
Voir l'originalRépondre0
SmartContractRebelvip
· 12-05 07:26
83,6 %, ce chiffre est vraiment incroyable, ça écrase complètement les solutions propriétaires des grands groupes. Qu'une version open source puisse dépasser Claude, ça veut dire quoi ? Ça veut dire que les grosses boîtes ne se foulent peut-être pas trop, haha. Ce qui m'intrigue vraiment, c'est de savoir si 300 scénarios de tâches, c'est assez réaliste... J'ai l'impression qu'il faudra du temps pour le vérifier. D'ailleurs, si ce genre d'IA capable d'automatiser l'ordinateur se démocratise, nous autres "manœuvres", on va finir au chômage, non ? Le nom Lux est bien trouvé, ça sonne vraiment "lumière", ça suggère que l'open source va sauver le monde, n'est-ce pas ? Cette fois, la fondation n'a vraiment pas exagéré, les données sont là, c'est bien plus crédible que les PPT des conférences officielles. On dirait que les benchmarks IA de 2024 deviennent vite des blagues, ce Lux débarque et chamboule tout le classement.
Voir l'originalRépondre0
CommunityWorkervip
· 12-05 07:21
83,6 % écrasent directement les autres, l’open source est-il vraiment aussi puissant ? J’ai l’impression que c’est un peu exagéré.
Voir l'originalRépondre0
SandwichVictimvip
· 12-05 07:19
83,6 % ces données sont vraiment incroyables, ça écrase directement Gemini et Claude, les modèles open source commencent à prendre leur revanche ? --- C'est vraiment une victoire pour la communauté open source, enfin quelqu'un a réussi à faire ça. --- Attends, pouvoir manipuler directement l'interface, ce n'est pas l'évolution ultime du RPA ? Si ça se généralise, ça fait un peu peur quand même. --- Encore plus puissant que Claude Sonnet ? J'ai l'impression que c'est un peu exagéré, non ? --- Vive l'open source, il est temps de briser le monopole des grands groupes. --- Cliquer directement à la souris et taper au clavier... Si ça devient vraiment utilisé, beaucoup de postes vont trembler.
Voir l'originalRépondre0
alpha_leakervip
· 12-05 07:17
83,6 % bat directement Gemini et Claude, cet open source est vraiment puissant, enfin quelqu'un a réussi à faire en sorte que l'IA contrôle l'ordinateur.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)