-
Au G7, Trump imposera son humeur et son calendrier
-
La Suède célèbre les noces d'or du couple royal
-
Rheinmetall n'exclut pas un retrait de Paris du char franco-allemand du futur
-
Téhéran et Washington sur le point de finaliser un accord, annonce le médiateur pakistanais
-
L'accusation de "narcoterroriste" a remplacé celle de "communiste" estime la Nobel de la paix Rigoberta Menchú
-
Budget: Lecornu demande à ses ministres de "corriger" les demandes des services
-
Washington invoque la sécurité nationale et force Anthropic à suspendre son IA la plus puissante
-
L'Iran et les Etats-Unis jugent un accord proche
-
Les Bourses mondiales terminent en hausse, saluent les débuts de SpaceX à Wall Street
-
SpaceX, l'entreprise qui promet Mars, en cinq moments forts
-
Wall Street en hausse, table sur un accord USA-Iran et salue l'entrée en Bourse de SpaceX
-
Adopter l'IA: à Lille, entreprises et chercheurs échangent sur ses usages concrets
-
Foot: la médaille de Pelé au Mondial-1958, mise aux enchères, devrait atteindre les 500.000 livres
-
SpaceX décolle au Nasdaq après la clôture en hausse des Bourses en Europe
-
La fortune d'Elon Musk franchit le seuil symbolique de mille milliards de dollars
-
Le monde politique et du spectacle aux obsèques de Bernadette Chirac à Paris
-
Fleurance accompagne Lyhanna jusqu'à sa dernière demeure
-
Les Bourses européennes tirées par la baisse du pétrole sur fond des promesses de SpaceX
-
Venezuela: mines et villages fantômes après l'opération militaire contre des sites contrôlés par les gangs
-
SpaceX prêt à un décollage historique à Wall Street, Elon Musk promet Mars
-
Wall Street en petite hausse, entre SpaceX et espoirs de paix au Moyen-Orient
-
Les marchés mondiaux portés par l'espoir d'un accord imminent entre Washington et Téhéran
-
Un fonds américain pourrait entrer au capital du groupe français Eramet, selon le FT
-
Aux Canaries, le pape réitère son soutien aux migrants et les appelle à s'intégrer
-
En France, l'arrivée d'énormes centres de données bouscule les territoires
-
Décès de Frank Michael, chanteur de charme italo-belge
-
Bac: les élèves de 1ère planchent sur la nouvelle épreuve de mathématiques
-
La Bourse de Paris prend 2,25%, galvanisée par les espoirs de paix au Moyen-Orient
-
Les Bourses mondiales grimpent, saluent les avancées vers un accord au Moyen-Orient
-
IA, robots et souveraineté numérique au cœur des 10 ans de VivaTech
-
Inde: un an après la catastrophe d'Air India, les familles cherchent à faire leur deuil et à comprendre
-
En Afrique, les motos électriques inondent le marché, portées par la guerre au Moyen-Orient
-
A la frontière du Bangladesh et de l'Inde, la "guerre" des migrants a repris
-
À Goussainville, la renaissance d'un village fantôme
-
Drones, missiles: l'expertise ukrainienne s'impose au salon de défense Eurosatory
-
Le New Jersey ouvre un musée célébrant son héros, Bruce Springsteen
-
Une colonie martienne et des datacenters spatiaux: les folles promesses de Musk aux investisseurs
-
Mondial-2026: à 15.000 km de Buenos Aires, un Indonésien fan inconditionnel de Messi
-
Téhéran dit ne pas avoir tranché sur un accord brandi par Trump après l'annulation de frappes
-
Les obsèques de Bernadette Chirac à Paris avant un hommage en Corrèze
-
SpaceX prêt à un décollage historique à Wall Street
-
Royaume-Uni: démissions en cascade au ministère de la Défense, Starmer sous pression
-
Wall Street termine en nette hausse, portée par l'Iran et la tech
-
SpaceX officialise son entrée en Bourse record pour vendredi
-
Le stade Azteca et Shakira lancent le Mondial-2026
-
Besançon: naissance "rarissime" d'un lémurien menacé
-
Trump menace de frapper "très fort" l'Iran, qui le met en garde contre un "bourbier sans fin"
-
Les Bourses européennes terminent en hausse malgré la hausse des taux de la BCE
-
Royaume-Uni: démission surprise du ministre de la Défense, sur fond de désaccord budgétaire
-
La BCE resserre la vis monétaire face au choc inflationniste du Moyen-Orient
Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts
L'émergence des agents d'intelligence artificielle (IA) a fait exploser la facture IA de bon nombre d'entreprises, qui se tournent vers des modèles moins coûteux pour ne pas rogner sur leur consommation.
Finie, l'ère de "l'intelligence subventionnée" - selon l'expression de Kevin Simback, de l'incubateur Delphi Labs - née avec ChatGPT et la déferlante de l'IA générative.
Pour favoriser l'adoption de cette nouvelle technologie, les grands acteurs du secteur, OpenAI en tête, ont proposé initialement des tarifs très attractifs, au point que leur activité était déficitaire.
"Mais le vent est en train de tourner", prévient Kevin Simback.
Chacun à leur tour, les poids lourds de l'IA ont récemment revu leurs prix pour les ajuster à l'utilisation réelle des capacités informatiques nécessaires pour faire tourner les modèles.
L'avènement des agents IA, des programmes capables d'effectuer des tâches et plus seulement de donner des réponses, a, en outre, fait bondir le recours aux infrastructures informatiques.
Pour une même mission, l'interface peut se démultiplier en plusieurs agents, chacun avec sa feuille de route, le tout assemblé et vérifié par d'autres agents.
A l'arrivée, le nombre de "tokens", unité de référence pour mesurer le résultat produit par l'IA, peut représenter des dizaines de fois celui correspondant à une simple question à ChatGPT.
Le tout s'inscrit dans une période de déséquilibre. Les centres de données et les fabricants de puces ne parviennent pas à suivre le rythme effréné de la demande d'intelligence artificielle, ce qui renchérit l'accès aux infrastructures.
"En particulier chez les développeurs, le coût d'utilisation de l'IA pour la programmation s'est accru de façon exponentielle", observe Mark Barton, de la société d'accompagnement numérique Omniux.
Par extension, pour tous les modèles de référence du marché, "les prix commencent à s'envoler", insiste-t-il.
Face à ce nouveau paradigme, certains questionnent le déploiement à tout crin de l'IA, tels l'enseigne de grande distribution Target, Starbucks ou Uber.
"Dans certains cas, le coût dépasse celui d'un employé au bout d'un mois ou deux parce qu'ils l'utilisent trop", décrit Jack Gold, président du cabinet J.Gold Associates.
- Pas d'IA "sans raison" -
Pourtant sacré, en début d'année, champion du "tokenmaxxing", mouvement qui glorifie la dépense maximale de "tokens" comme mètre étalon de productivité des employés, Meta a récemment mis le hola.
"Personne ne devrait recourir à des outils IA sans raison", a ainsi écrit le responsable technologique du groupe, Andrew Bosworth, dans un mémo interne relayé par le Wall Street Journal.
Mais si le discernement est désormais de mise, la plupart des sociétés cherchent surtout à accéder à une IA moins onéreuse, en recourant à des modèles moins performants que les fleurons du secteur.
Dans ce contexte, la popularité des modèles dits "open weights", téléchargeables gratuitement, est croissante, leur usage ne nécessitant que l'achat de puissance de calcul.
Les entreprises se tournent aussi vers des modèles de plus petite taille, les SLM (small language models) en lieu et place des LLM, qui servent de base à ChatGPT, Claude ou Gemini.
Ces SLM peuvent parfois tourner sur les serveurs locaux ou même directement sur l'ordinateur, une option plus économique car elle évite de payer un fournisseur de capacité à distance (cloud).
Il est aussi possible de scinder une demande unique (prompt) en étapes distinctes pour les confier, à chaque fois, à l'interface adaptée, explique Adrian Balfour, du cabinet de conseil numérique Enverso.
"Quand vous passez par un grand modèle monolithique, vous en aurez à peu près pour 15 dollars le million de +tokens+ alors qu'en prenant des mini-modèles, vous ferez descendre le tout à 5 cents", assure-t-il.
Beaucoup voient dans cette refonte la première étape de la banalisation des modèles, devenus interchangeables sans déperdition.
Dès lors, ce sont les plateformes de sélection et de coordination des modèles et des agents qui prennent de l'importance, selon John Belton, gérant au sein de la société d'investissement Gabelli Funds.
Sur ce créneau, des start-up se battent avec des mastodontes du "cloud" comme Amazon, qui propose déjà de jongler avec une multitude d'IA via sa plateforme Bedrock, mais aussi les géniteurs de l'intelligence artificielle eux-mêmes.
Anthropic dispose ainsi d'une gamme complète de modèles, dont Haiku, l'option la plus économique, à l'instar d'OpenAI et de Google.
John Belton ne voit d'ailleurs pas ces étoiles de l'IA perdre des parts de marché à mesure que les clients cherchent l'efficacité plutôt que la performance.
"Les utilisateurs les plus avancés seront toujours prêts à payer" pour ce qui se fait de mieux, prévoit-il. "Le gâteau ne fait que grossir."
P.Petrenko--CPN