((Traduction automatisée par Reuters, veuillez consulter la clause de non-responsabilité https://bit.ly/rtrsauto)) par Eduardo Baptista
Le lancement par la startup chinoise DeepSeek de ses derniers modèles d'IA, qui, selon elle, sont au moins aussi performants que les modèles américains de pointe pour une fraction du prix, menace de bouleverser l'ordre mondial de la technologie.
L'entreprise a attiré l'attention des cercles mondiaux de l'IA après avoir écrit dans un article le mois dernier que l'entraînement de DeepSeek-V3 nécessitait moins de 6 millions de dollars de puissance de calcul provenant de puces Nvidia H800.
L'assistant IA de DeepSeek, basé sur DeepSeek-V3, a dépassé son rival , ChatGPT, pour devenir l'application gratuite la mieux notée sur l'App Store d'Apple aux États-Unis.
Cela a soulevé des doutes quant au raisonnement qui sous-tend la décision de certaines entreprises technologiques américaines d'investir des milliards de dollars dans l'IA et les actions de plusieurs grands acteurs technologiques, dont Nvidia, ont été touchées.
Voici quelques informations sur l'entreprise qui secoue le secteur de l'IA dans le monde entier.
POURQUOI DEEPSEEK FAIT-IL PARLER DE LUI?
La sortie du ChatGPT d'OpenAI à la fin de 2022 a provoqué une ruée parmi les entreprises technologiques chinoises , qui se sont empressées de créer leurs propres chatbots alimentés par l'intelligence artificielle.
Mais après la publication du premier équivalent chinois de ChatGPT, réalisé par le géant des moteurs de recherche Baidu
9888.HK , la déception a été générale en Chine face à l'écart entre les capacités des entreprises américaines et chinoises en matière d'intelligence artificielle.
La qualité et le rapport coût-efficacité des modèles de DeepSeek ont fait basculer ce discours. Les deux modèles qui ont fait l'objet d'éloges de la part de cadres de la Silicon Valley et d'ingénieurs d'entreprises technologiques américaines, DeepSeek-V3 et DeepSeek-R1, sont comparables aux modèles les plus avancés d'OpenAI et de Meta, a déclaré la startup chinoise.
Ils sont également moins chers à utiliser. Le DeepSeek-R1, sorti la semaine dernière, est 20 à 50 fois moins cher à utiliser que le modèle OpenAI o1, en fonction de la tâche, selon un message publié sur le compte WeChat officiel de DeepSeek.
Mais certains ont publiquement exprimé leur scepticisme quant à la réussite de DeepSeek.
Le directeur général de Scale AI, Alexandr Wang, a déclaré lors d'une interview avec CNBC jeudi, sans fournir de preuves, que DeepSeek disposait de 50 000 puces Nvidia H100, qu'il a affirmé ne pas vouloir divulguer parce que cela violerait les contrôles à l'exportation de Washington qui interdisent la vente de ces puces d'IA avancées à des entreprises chinoises. DeepSeek n'a pas répondu immédiatement à une demande de commentaire sur cette allégation.
Les analystes de Bernstein ont souligné lundi dans une note de recherche que les coûts de formation totaux de DeepSeek pour son modèle V3 étaient inconnus, mais qu'ils étaient beaucoup plus élevés que les 5,58 millions de dollars que la startup a déclaré avoir utilisés pour la puissance de calcul. Les analystes ont également indiqué que les coûts de formation du modèle R1, tout aussi acclamé, n'ont pas été divulgués.
QUI SE CACHE DERRIÈRE DEEPSEEK?
DeepSeek est une startup basée à Hangzhou dont l'actionnaire majoritaire est Liang Wenfeng, cofondateur du fonds spéculatif quantitatif High-Flyer, d'après les registres d'entreprise chinois.
Le fonds de Liang a annoncé en mars 2023 sur son compte WeChat officiel qu'il "repartait à zéro", allant au-delà du commerce pour concentrer ses ressources sur la création d'un "nouveau groupe de recherche indépendant, afin d'explorer l'essence de l'AGI" (Artificial General Intelligence). DeepSeek a été créé plus tard dans l'année.
Les créateurs de ChatGPT, OpenAI, définissent l'AGI comme des systèmes autonomes qui surpassent les humains dans la plupart des tâches à valeur économique.
On ne sait pas exactement combien High-Flyer a investi dans DeepSeek. High-Flyer possède des bureaux dans le même bâtiment que DeepSeek, ainsi que des brevets relatifs à des grappes de puces utilisées pour entraîner des modèles d'IA, selon les registres d'entreprise chinois.
L'unité d'IA de High-Flyer a déclaré sur son compte WeChat officiel en juillet 2022 qu'elle possédait et exploitait une grappe de 10 000 puces A100.
QUELLE EST LA POSITION DE PEKIN SUR DEEPSEEK?
Le succès de DeepSeek a déjà été remarqué dans les principaux cercles politiques chinois. Le 20 janvier, jour où DeepSeek-R1 a été rendu public, le fondateur Liang a assisté à un symposium à huis clos pour les hommes d'affaires et les experts organisé par le premier ministre chinois Li Qiang, selon l'agence de presse d'État Xinhua.
La présence de M. Liang à cette réunion est un signe potentiel que le succès de DeepSeek pourrait être important pour l'objectif politique de Pékin de surmonter les contrôles à l'exportation de Washington et d'atteindre l'autosuffisance dans des industries stratégiques telles que l'IA.
Robin Li, directeur général de Baidu, avait participé à un symposium similaire l'année dernière.
1 commentaire
Vous devez être membre pour ajouter un commentaire.
Vous êtes déjà membre ? Connectez-vous
Pas encore membre ? Devenez membre gratuitement
Signaler le commentaire
Fermer