-
Wall Street tente un rebond après les déboires de la tech
-
Elton John, en colère, accuse le Daily Mail d'atteintes "odieuses" à sa vie privée
-
Euro numérique: la BCE presse l'UE d'éviter tout retard législatif
-
Stellantis passe des charges colossales après avoir pris du retard dans l'électrique
-
La fin de l'ISS, symbole d'une ère de coopération internationale
-
Toyota change de PDG et relève ses prévisions, ventes solides malgré les droits de douane
-
Malgré les mises à l'épreuve par l'administration Trump, Ørsted dans le vert en 2025
-
Amazon brille par ses résultats mais inquiète avec des dépenses records pour l'IA
-
Les Japonais attendus aux urnes, Trump soutient la Première ministre en quête de majorité
-
Cuba se dit "prêt au dialogue", les Etats-Unis affirment que des discussions sont en cours
-
L'ex-Premier ministre norvégien Thorbjørn Jagland rattrapé par l'affaire Epstein
-
Jeux vidéos, IA, algorithmes et ingérences: Macron dévoile de nouvelles pistes de régulation
-
Wall Street mise sous pression par la mauvaise passe de la tech
-
Jeffrey Epstein, conseiller et confident de la banquière Ariane de Rothschild
-
Les organisateurs du forum de Davos ouvrent une enquête sur les liens de son patron avec Jeffrey Epstein
-
IA: Anthropic sort un nouveau modèle et la rivalité avec OpenAI s'intensifie
-
Désarmement nucléaire: Trump réclame un traité "modernisé" avec la Russie
-
Selon Elon Musk, "l'argent ne fait pas le bonheur"
-
IA: Anthropic sort un nouveau modèle et intensifie la compétition avec OpenAI
-
Premiers tests concluants pour Tara Polar Station, départ prévu en juillet
-
Enseignante poignardée à Sanary-sur-Mer: l'élève placé en détention provisoire
-
Albanie : le gouvernement suspend l'interdiction de TikTok
-
Pour Sophie Adenot, un programme scientifique chargé dans l'ISS
-
Après des années d'attente, le gouvernement présente un plan contre l'infertilité
-
Wall Street recule, la pression sur la tech s'intensifie
-
Affaire Epstein/Mandelson: Starmer s'excuse mais entend rester à Downing Street
-
La BCE maintient ses taux face à l'euro fort et l'inflation ralentie
-
Dépression Leonardo: la situation reste "difficile" en Andalousie, risque "maximal" de crue du Tage au Portugal
-
Polémique sur l'épandage du sel à Berlin, paralysée par le verglas
-
Japon: le premier parc à thème permanent "Pokémon" ouvre ses portes à Tokyo
-
Norvège: jugé pour viols, le fils de la princesse Mette-Marit nie avoir drogué quiconque
-
Peur et détermination sur le rail ukrainien pilonné par les attaques russes
-
Dépression Leonardo: fin de l'alerte rouge en Andalousie, où une femme est portée disparue
-
La Bourse de Paris prudente avant la BCE
-
Londres-Heathrow premier aéroport européen, Istanbul en embuscade
-
Aux Etats-Unis, la "galère" du quotidien pour les foyers modestes
-
Sophie Adenot, une vie à rêver d'espace
-
Des grandes surfaces au gouvernement, Serge Papin nouveau chantre du "Made in France"
-
L'est de Cuba privé de courant à la suite d'une panne
-
BCE: l'euro fort et l'inflation au ralenti en ligne de mire jeudi
-
Le crooner Barry Manilow annule ses concerts à Las Vegas
-
La fumée des feux de forêt tue plus de 24.000 Américains par an, selon une étude
-
Wall Street: le désintérêt pour la tech profite aux secteurs traditionnels
-
La CGT alerte sur des libertés syndicales "en danger"
-
Maroc: plus de 100.000 personnes évacuées préventivement face aux intempéries
-
La Russie "plus liée" par le traité moribond New Start
-
L'envoi d'astronautes autour de la Lune pas avant mars, annonce la Nasa
-
Le Commerce Equitable veut plus de transparence dans nos tasses de thé
-
Un documentaire revient sur l'histoire de Lucy Letby, l’infirmière britannique tueuse de nouveaux-nés
-
Bourses: Paris et Londres terminent en hausse, Francfort en retrait
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.
"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.
"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."
A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.
C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.
Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.
"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.
"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."
Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.
"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."
- Tromper les humains -
Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.
"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.
La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.
L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.
Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.
"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."
Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.
"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.
Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."
Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.
Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.
Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.
"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.
Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.
"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."
C.Peyronnet--CPN