
Yaoundé, 28 janvier 2025 (CAPnews) – C’est un véritable coup de tonnerre dans l’univers de l’IA. DeepSeek, une jeune entreprise chinoise spécialisée dans l’IA générative, a surpris tout le monde avec le lancement de son dernier modèle de langage (LLM), baptisé R1, conçu pour résoudre des problèmes complexes.
Publié en open source, ce modèle a provoqué une onde de choc aux États-Unis. La raison de cette agitation ? Alors que R1 affiche des performances comparables à celles des meilleurs LLM américains, notamment o1, le fleuron d’OpenAI, DeepSeek affirme n’avoir utilisé que 2 048 processeurs graphiques (GPU) de Nvidia et dépensé seulement 5,6 millions de dollars pour développer ce modèle, qui compte pourtant 671 milliards de paramètres. Une somme dérisoire comparée aux 25 000 GPU et aux 100 millions de dollars investis par OpenAI pour entraîner son modèle GPT-4.
DeepSeek, un modèle compétitif
Une révolution dans le monde de l’IA, mais ce n’est pas tout. En raison des restrictions imposées par les États-Unis sur l’exportation de puces d’IA haut de gamme vers la Chine, DeepSeek a entraîné son modèle avec des puces moins performantes que celles utilisées par les géants américains. La puce H800, une version bridée de la Nvidia H100, a été conçue spécifiquement pour contourner ces sanctions. Malgré cela, DeepSeek a réussi à créer un modèle compétitif.
L’application de chatbot grand public proposée par DeepSeek, similaire à ChatGPT, a rapidement suscité l’engouement et occupe actuellement la première place sur l’App Store aux États-Unis. DeepSeek propose également des versions allégées de son modèle R1, qui nécessitent moins de paramètres et peuvent fonctionner sur du matériel moins puissant, comme une Nvidia RTX 3080, couramment utilisée par les gamers. Cela change complètement la donne. R1 semble même surpasser 4o, le modèle multimodal phare d’OpenAI, tout en étant capable de tourner sur un simple GPU de gaming.
L’arrivée fracassante de ce nouvel acteur chinois sur le marché de l’IA remet en cause un paradigme que l’on croyait immuable : celui selon lequel seuls les géants technologiques américains, avec leurs ressources financières colossales, pouvaient rivaliser dans ce domaine. Jusqu’à présent, on pensait que développer un modèle d’IA générative capable de concurrencer les meilleurs nécessitait des investissements massifs en matériel et en puissance de calcul, créant ainsi une barrière à l’entrée pour les nouveaux acteurs. Avec DeepSeek, cette logique est bouleversée.
La fin du monopole américain
Les géants de la tech ont investi massivement dans des centres de données dédiés à l’IA générative, équipés de milliers de GPU haut de gamme de Nvidia. Par exemple, Meta prévoit d’investir dix milliards de dollars dans un tel centre en Louisiane, tandis qu’Amazon prévoit d’en dépenser onze milliards dans l’Indiana.
Le succès de DeepSeek constitue un revers pour la stratégie d’endiguement menée par les États-Unis contre la Chine, visant à limiter l’accès aux technologies de pointe. Non seulement ces sanctions n’ont pas empêché la Chine de progresser, mais elles ont poussé les chercheurs chinois à innover davantage.