Rapport approfondi de Goldman Sachs : le tournant imminent Décryptage de l'économie des agents intelligents IA

robot
Création du résumé en cours

L’IA agentique (Agentic AI) est en train de faire passer l’industrie de l’intelligence artificielle d’une narration axée sur les coûts à une narration axée sur les profits. Goldman Sachs estime qu’avec une croissance explosive imminente de la consommation de tokens, et alors que le coût de calcul sous-jacent diminue à un rythme supérieur à la baisse du prix des tokens, le point d’inflexion de la marge brute des grands fournisseurs de cloud et de modèles de grande taille pourrait survenir dans les 3 à 12 prochains mois.

Selon Chase Wind Trading, un rapport publié par Goldman Sachs le 5 mai indique que, d’ici 2030, les agents IA pour le consommateur et l’entreprise contribueront ensemble à faire croître la consommation mondiale de tokens de 24 fois par rapport au niveau de 2026, atteignant environ 120 milliards de tokens par mois ; si l’on considère que l’adoption maximale des agents pour les entreprises atteindra son pic d’ici 2040, ce chiffre s’élargira encore à 55 fois.

Par ailleurs, la courbe de prix et de coûts extrapolée par Goldman Sachs montre que le prix des tokens pour les grands modèles principaux s’est stabilisé, voire a légèrement augmenté après une baisse d’environ 40 % par an auparavant ; en même temps, le coût de calcul par token alimenté par des puces telles que Nvidia, AMD, Google TPU et Trainium continue de diminuer à un rythme annuel de 60 à 70 %, créant un écart de ciseaux entre ces deux courbes qui ouvre un espace de profit pour l’industrie. Les investissements massifs dans l’infrastructure IA pourraient devenir plus durables grâce à l’amélioration des marges.

Point d’inflexion de l’économie des tokens : la baisse des coûts dépasse la baisse des prix, le potentiel de profit s’ouvre

L’argument central du rapport de Goldman Sachs est que l’industrie de l’IA évolue d’une phase où “l’incertitude économique de la déduction peut diluer les profits” vers une nouvelle phase où “l’augmentation des tokens avec une marge marginale attrayante permet de réaliser des gains”.

Dans la première phase du cycle IA, les investisseurs considéraient généralement la puissance de calcul et les tokens comme des facteurs de coût — plus d’utilisation signifiait plus de charge de déduction, plus d’accélérateurs, plus d’électricité et des investissements en capital plus importants. Mais la courbe de prix et de coûts extrapolée par Goldman Sachs indique que cette logique est en train de changer.

Bien que le prix des tokens pour les grands modèles ait considérablement diminué, il s’est maintenant stabilisé, voire a rebondi dans certains cas ; parallèlement, le coût total de calcul par token pour Nvidia, Google TPU (Broadcom), AMD et Trainium (Marvell) continue de diminuer rapidement et de façon soutenue. Si le prix des tokens reste supérieur au coût de calcul, l’augmentation de l’adoption de l’IA agentique entraînera une expansion positive des profits, plutôt qu’une simple croissance des revenus.

Goldman Sachs souligne également que l’IA agentique pourrait créer un cercle économique auto-renforçant : des coûts de calcul par token plus faibles favorisent la création d’agents plus riches et plus complexes ; ces agents plus riches, en utilisant des contextes plus longs, plus de cycles, plus de vérifications et une surveillance continue, consommeront davantage de tokens ; une meilleure utilisation améliorera la rentabilité de l’infrastructure IA, soutenant ainsi un investissement continu dans la qualité et la distribution des modèles. Goldman Sachs considère que ce cercle vertueux diffère radicalement de la narration dominante selon laquelle “l’utilisation de l’IA entraînera des coûts insoutenables”.

Cependant, Goldman Sachs met aussi en garde contre certains risques : tous les workloads IA ne garantiront pas un point d’inflexion positif. Pour les chatbots purement textuels très commercialisés, la concurrence pourrait encore forcer la vitesse de baisse des prix des tokens à dépasser celle du coût de calcul.

Agents pour le consommateur : de la conversation fragmentée à l’assistant “permanent”, la consommation de tokens augmentera de 12 fois

Goldman Sachs estime qu’en 2030, les agents IA pour le consommateur pourraient multiplier par 12 la consommation mondiale de tokens, avec environ 60 milliards de tokens supplémentaires par mois.

Le rapport divise les agents pour le consommateur en deux catégories : d’une part, les agents “sur demande”, comme OpenAI Operator, Claude Code, qui sont des agents côté navigateur initiés par l’utilisateur, planifiant, exécutant et renvoyant les résultats de manière autonome ; d’autre part, les agents “permanents”, comme ceux qui surveillent en continu les emails, gèrent les agendas ou servent d’assistants numériques dans la vie quotidienne. Goldman Sachs pense que le plus grand saut dans la consommation de tokens se produira lorsque les agents passeront d’une initiation par l’utilisateur à une exécution continue en arrière-plan — surveillant le contexte en permanence et agissant de manière proactive lorsque nécessaire.

Données simulées : un chatbot LLM ordinaire consomme environ 1 000 tokens par session, Copilot intégré consomme plus de 5 000 tokens par jour, tandis qu’un agent permanent peut dépasser 100 000 tokens par jour.

Goldman Sachs prévoit qu’en 2030, le volume de requêtes IA quotidiennes passera d’environ 5 milliards en 2025 à environ 23 milliards, dont jusqu’à 30 % seront destinés à des agents dans des domaines comme la recherche, le shopping, le voyage, les emails et la productivité personnelle. Par ailleurs, la part des moteurs de recherche traditionnels dans le volume de requêtes devrait passer de 68 % en 2025 à 36 % en 2030, tandis que la part des applications natives LLM passera de 12 % à 31 %.

Agents pour l’entreprise : la complexité des flux de travail stimule la puissance de token, la consommation pouvant atteindre 55 fois d’ici 2040

Goldman Sachs prévoit que les agents IA pour l’entreprise deviendront le principal multiplicateur de tokens, contribuant à une croissance de 24 fois de la consommation mondiale de tokens d’ici 2030, et atteignant un pic de 55 fois en 2040, lorsque la charge de travail des entreprises représentera plus de 70 % de la consommation totale de tokens.

La raison pour laquelle les agents d’entreprise ont une puissance de token plus forte que ceux pour le consommateur réside dans la complexité accrue de leurs flux de travail — surveillance de tâches, récupération de contexte, détection d’anomalies, validation des résultats, mise à jour des systèmes, et rapport continu tout au long de la journée. De plus, ils impliquent souvent des entrées multimodales plus lourdes (voix, images, documents, activités à l’écran, données d’applications, journaux et enregistrements structurés), ce qui augmente considérablement la consommation de tokens.

Goldman Sachs a quantifié la consommation de tokens pour différents métiers en construisant des agents simulés.

Les résultats montrent qu’un agent de programmation consomme environ 7 millions de tokens par jour, avec un coût API d’environ 13 dollars par jour, bien inférieur au coût humain ; un agent de centre d’appels consomme environ 2 millions de tokens par jour, mais si une reconnaissance vocale en temps réel est utilisée, le coût peut atteindre 92 dollars par jour, rendant l’automatisation vocale complète économiquement peu compétitive ; un agent de saisie de données consomme environ 25 millions de tokens par jour, pour un coût d’environ 60 dollars, toujours inférieur au coût humain.

Goldman Sachs indique que la vitesse d’adoption des agents d’entreprise dépendra de quatre variables : la quantité de tokens, le coût de l’API, la modalité et la complexité de mise en œuvre. Les flux de travail principalement textuels avec un écosystème d’outils mature seront les premiers à se déployer à grande échelle ; ceux principalement vocaux ou intégrant profondément des systèmes en arrière-plan pourraient progresser plus lentement.

Selon la courbe d’adoption, Goldman Sachs pense que l’IA agentique d’entreprise suivra probablement une courbe en S, avec un taux d’adoption maximal d’environ 35 à 40 % des travailleurs du savoir, atteignant le pic en environ 15 ans, plus rapide que la médiane historique de diffusion technologique (29 ans).

Durabilité des investissements : l’amélioration des profits offre plus d’espace aux grands fournisseurs de cloud

Une conclusion clé du rapport de Goldman Sachs est que l’amélioration des marges des grands fournisseurs de cloud rendra l’investissement infrastructurel actuel plus durable, dissipant ainsi les principales inquiétudes du marché concernant le retour sur investissement dans l’IA.

Le rapport souligne que, actuellement, les opérateurs sont encore limités par l’offre pour répondre à la demande de puissance de calcul présente et future. Google et Meta ont tous deux relevé leurs prévisions d’investissement en capital pour 2026, et la direction d’Amazon a réaffirmé sa stratégie de maintien d’investissements élevés après ses résultats du premier trimestre. Goldman Sachs prévoit qu’à mesure que le point d’inflexion des profits approche, les investisseurs rechercheront de plus en plus des preuves de rentabilité.

Concernant les cibles spécifiques, Goldman Sachs considère que la croissance du revenu AWS, qui a augmenté de 28 % en glissement annuel au premier trimestre, et ses commandes en attente de 364 milliards de dollars, sont des indicateurs clés ; pour Google, la croissance de 63 % de ses activités cloud en glissement annuel et le doublement presque de ses commandes en attente à environ 460 milliards de dollars ; pour Meta, la croissance significative de ses revenus publicitaires, surpassant largement l’industrie de la publicité numérique, ainsi que la contribution continue de l’IA à l’engagement utilisateur et à la monétisation des annonces.

Dans le domaine logiciel, la baisse des coûts des tokens facilite l’intégration d’agents dans les produits existants sans impacter significativement la marge brute, tout en permettant une tarification basée sur les résultats, la productivité ou les unités de travail plutôt que sur le nombre de sièges, élargissant ainsi le marché adressable. Pour les sociétés de services informatiques, la migration de l’IA vers des flux de travail d’entreprise hautement intégrés, avec des besoins accrus en intégration, gouvernance et orchestration hébergée, profite principalement à des acteurs comme Accenture, considéré comme un bénéficiaire clé de cette tendance.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler