IA : avec le chatbot DeepSeek, l’affront chinois au dogme américain
L’émergence de la start-up chinoise DeepSeek, a porté un coup aux géants américains leur prouvant que d’autres acteurs pouvaient s’immiscer dans un secteur qu'ils considéraient acquis.
Ce document technique de 22 pages est passé inaperçu pendant plusieurs jours. Les explications de produit d’une start-up chinoise dont personne n’avait entendu parler, DeepSeek, ont pourtant effacé lundi près de 600 milliards de dollars de valeur de l’une des plus grandes firmes américaines, le fabricant de puces Nvidia, ébranlant la confiance de Wall Street dans la révolution de l’intelligence artificielle et portant un coup aux géants américains qui ont déjà englouti dans leurs recherches des dizaines de milliards, pour se retrouver soudainement côte à côte avec un logiciel gratuit venant de Chine qui paraît tout à fait capable de les concurrencer.
DeepSeek affirme qu’elle a produit son chatbot maison avec un investissement de 6 millions de dollars, chiffre mythologique chez les geeks mais probablement sous-estimé. Mais même si on le multipliait par dix, même si on le multipliait par cent, il resterait un affront au dogme américain : la veille encore, Meta annonçait un investissement de 60 milliards de dollars pour 2025, et OpenAI confirmait faire partie du projet Stargate annoncé par Donald Trump pour 500 milliards.
Même en supposant que leurs produits seront meilleurs que ceux qui pourraient être inventés pour un millième de ce coût par des firmes chinoises, indiennes, israéliennes ou coréennes (ou, pourquoi pas, françaises), le grand public en aurait-il besoin ? Les PME qui étaient supposées acheter les abonnements aux chatbots américains le feraient-elles, pour des questions d’image ou de politique, si un logiciel presque aussi performant leur était proposé gratuitement ? En 1720, alors que les employés de sa banque s’étonnaient de ses investissements en mer du Sud, John Martin de la Martins Bank avait fameusement expliqué : «Quand le monde devient fou, nous devons l’imiter dans une certaine mesure.» Mais quand une folie mondiale apparaît soudain comme une bulle spéculative, les imitateurs disparaissent très rapidement, que ce soit en mer du Sud ou en mer de Chine.
Comparaison avec ChatGPT… DeepSeek, trop bot pour être vrai ?
Ce robot conversationnel expérimental mis en ligne la semaine dernière, pourrait bousculer les mastodontes américains de l’intelligence artificielle. Ce «chatbot» est présenté comme beaucoup moins gourmand en ressources, au moins sur le papier. Aujourd’hui, DeepSeek, entreprise chinoise spécialisée dans l’intelligence artificielle, fait trembler les marchés américains.
La raison ? Elle serait parvenue à renverser la table mondiale du secteur, érigée à coups de milliards par les toutes-puissantes firmes américaines. Et cela, en dépit de la féroce rivalité entre les deux pays et de l’embargo imposé par les Etats-Unis depuis deux ans sur certains des produits technologiques très précieux dans cette course au futur. Le 20 janvier, DeepSeek a lancé son agent conversationnel à coût réduit : DeepSeek-R1. D’après les premières expertises, ce «chatbot» pourrait jouer dans la même cour que le leader ChatGPT en termes de performance, suscitant un vent d’inquiétude parmi les géants de la tech et à Wall Street.
Qu’est-ce que DeepSeek ?
C’est le nom de la start-up chinoise responsable de DeepSeek-R1, devenu ce week-end l’application gratuite la plus téléchargée sur l’App Store. Disponible sur ordinateur et téléphone, ce «chatbot» – un programme informatique simulant une conversation humaine – est capable d’écrire des poèmes, de rédiger un devoir ou encore de proposer une recette en fonction des ingrédients de votre frigo.
En surface, l’outil est en tout point similaire à ChatGPT, mis en ligne par OpenAI en novembre 2022. Toutefois, ses capacités à converser se trouvent être limitées sur certains sujets sensibles, en raison de ses racines chinoises. En revanche, DeepSeek est en «open source». Cela signifie que le code de l’application est accessible à tous, permettant de comprendre son fonctionnement, de le modifier et de se le réapproprier. Tout le contraire de ses rivaux, en particulier d’OpenAI, qui, «malgré son nom, est le plus fermé de tous les grands modèles de langage disponibles», explique le mathématicien Cédric Villani. Le directeur scientifique de l’IA chez Meta, Yann Le Cun, «dont le jugement est d’ordinaire très sûr, a pris position et a salué […] une avancée importante, non de la Chine, mais de la démarche», avance également l’ancien député.
En tout cas, du côté des Etats-Unis, leader mondial du secteur de l’IA, l’engouement soudain autour du chatbot chinois ne laisse pas indifférent. Lundi 27 janvier, Donald Trump a jugé que DeepSeek constituait un «avertissement» pour les industriels américains à «rester très concentrés sur la concurrence pour gagner». Même son de cloche du côté de l’entreprise californienne Scale AI. Sur X, son patron, Alexandr Wang affirme que «DeepSeek est un signal d’alerte pour l’Amérique». Et pour cause : le logiciel chinois serait aussi fort que l’une des meilleures versions de ChatGPT, OpenAI o1, le tout pour un coût moindre, avec des composants moins performants.
Meilleur que ChatGPT, vraiment ?
C’est ce qu’elle prétend. Que ce soit dans son codage ou dans la qualité de ses réponses, son modèle de raisonnement phare R1 présenterait des performances «équivalentes» voire «dépassant légèrement» celles de o1 de ChatGPT. Un modèle de raisonnement – côté chinois ou américain – fonctionne avec «plusieurs étapes qui permettent de construire une réponse plus élaborée», éclaire le spécialiste de l’IA Maxime Moffront, consultant chez Rhapsodies. Idéal pour résoudre des problèmes mathématiques, par exemple, en les découpant en plusieurs strates.
Ce fonctionnement permet ainsi à DeepSeek-R1 de se hisser au niveau de la société californienne OpenAI, valorisée à quelque 157 milliards de dollars. Sam Altman, son PDG et cocréateur de ChatGPT, a même qualifié ce compétiteur asiatique imprévu d’«impressionnant». Mais, en bon entrepreneur, a rapidement prédit la victoire de son propre camp avec de «bien meilleurs modèles» à venir.
Faire tout autant, voire plus, avec moins ?
Sur leurs compétences, OpenAI et DeepSeek frôlent donc l’égalité. Mais il y a un domaine où la start-up chinoise rafle largement la mise : les coûts, qu’ils soient financiers ou énergétiques. C’est le point qui a affolé l’industrie et mis les investisseurs en alerte : pour développer l’IA chinoise, seuls deux mois et moins de 6 millions de dollars auraient été nécessaires. Une bagatelle si l’on compare aux centaines de milliards pulvérisés par OpenAI, Meta, Microsoft et compagnie.
Surtout, la société chinoise avance n’avoir eu recours qu’à 2 000 puces H800 de Nvidia, les moins avancées, pour entraîner sa technologie. En règle générale, les leaders américains utilisent huit fois plus de ces composants électroniques, énergivores mais utiles pour traiter de grandes quantités de données. Résultat : lundi, Nvidia perdait près de 590 milliards de dollars de valorisation boursière en une journée. Un record historique.
DeepSeek pourrait donc faire aussi bien que les grands avec moins… Mais comment ? Sur ce point, plusieurs explications techniques sont avancées. Comme le relève Mashable, la société emploierait une méthode baptisée «mixture of experts», consistant à utiliser plusieurs modèles d’IA spécialisés plutôt qu’un seul généraliste plus gros. De quoi gagner en rapidité et en puissance de calcul. Le Monde repère également que DeepSeek utiliserait des nombres codés en 8 bits, une définition moins bonne mais plus légère que les 32 ou 16 bits.
Des économies effectuées ici et là dans la construction de l’algorithme qui aujourd’hui plongent le secteur de l’IA dans une crise existentielle : et si le modèle américain s’était planté sur toute la ligne ? «DeepSeek remet en question les choix américains dans la construction de leurs modèles d’IA et souligne leur dimension culturelle – qui nous semblait jusqu’alors naturelle – à vouloir faire ‘toujours plus gros’, analyse le journaliste et fondateur du Synth Média, Gérald Holubowicz. Et d’ajouter : «La start-up souligne aussi que l’Europe, l’Afrique ou encore l’Amérique latine ont aussi la possibilité de mettre au point des modèles d’IA performants.»
Peut-on vraiment croire à ces annonces ?
Il n’aura pas fallu attendre bien longtemps avant que certains ne s’élèvent pour mettre à mal la version de DeepSeek sur ses exploits. C'est le cas du milliardaire Elon Musk, qui a abondamment investi dans sa propre start-up d’intelligence artificielle xAI. Sans surprise, il a accusé l’entreprise chinoise d’accéder secrètement aux puces H100 de Nvidia, contournant ainsi l’embargo américain qui limite l’exportation de ces semi-conducteurs vers la Chine.
Mais Maxime Moffront tempère : «Un expert du domaine, Ben Thompson, a analysé qu’il était effectivement possible d’arriver au résultat de DeepSeek uniquement avec des H800. Donc, pas besoin de spéculer sur le fait qu’ils aient des H100 ou non.» Et si les Etats-Unis n’ont pas réalisé une telle prouesse, c’est tout simplement parce qu’ils n’avaient «pas besoin de le faire», étant en possession des meilleures puces sur le marché, estime l’expert.
Que penser, aussi, des sommes avancées, dérisoires pour un projet d’une telle envergure ? «Il est trop tôt pour savoir à quoi s’en tenir mais au vu du gigantesque coup de bluff qui imprègne tout le sujet, il n’y a a priori aucune raison de faire confiance à DeepSeek», souffle Cédric Villani. Les fameux 6 millions de dollars ne comprendraient pas, en réalité, le coût de la conception du logiciel dans son intégralité, mais seulement le passage d’une version moins antérieure, DeepSeek-V3, à DeepSeek-R1.
Toujours est-il que si la start-up veut rester dans la course, il va falloir progresser, et vite. «Ce logiciel en tant que tel ne va pas survivre très longtemps. Sans évolution importante, on n’en parlera plus dans six mois, prédit Maxime Moffront. Mais maintenant, on sait que les Chinois ont les compétences pour rivaliser avec les mastodontes de l’IA.»
Sources Libération