1. Définition & Origines
DeepSeek est une startup chinoise spécialisée dans l’intelligence artificielle, fondée en juillet 2023 à Hangzhou par Liang Wenfeng, également cofondateur du fonds High-Flyer Wikipediaeuronews.
L’entreprise est installée à Hangzhou, et son objectif est de développer des grands modèles linguistiques (LLM) puissants, accessibles et open source ou avec poids ouverts Wikipedia+1TIME.
2. Évolution des modèles
DeepSeek-Coder — Lancement en novembre 2023. Modèle open source dédié à la génération de code euronewsdeepseek-ai.inWikipédia.
DeepSeek-V2 — Déployé en mai 2024, avec variantes V2-Chat, V2-Lite, DeepSeek-Coder-V2, etc. Incorporait des technologies telles que l’attention latente multi-têtes (MLA) et une architecture MoE Wikipédiaeuronews.
DeepSeek-V3 — Lancé en décembre 2024. Modèle Mixture-of-Experts (MoE) avec 671 milliards de paramètres (37 B activés par token), pré-entraîné sur 14,8 billions de tokens avec efficacité énergétique / coût maîtrisé arXivdeepseek-ai.in.
DeepSeek-R1 — Dévoilé en janvier 2025, conçu pour le raisonnement, le code et les mathématiques. Son API et chatbot ont été très populaires, atteignant le sommet des applications gratuites sur l’App Store US WikipediaeuronewsBusiness InsiderBBC.
3. Caractéristiques principales
Performance & coût : DeepSeek R1 a été entraîné pour environ 5,6 millions de dollars, soit un coût nettement inférieur aux modèles occidentaux comme GPT-4 (estimé à >100 millions) matérielle : Environ 2 000 GPU H800 utilisés, environ 1/10 de la puissance requise par certains autres modèles .
Raisonnement & logique : Excellente performance en mathématiques, codage et compréhension via architectures Mixture-of-Experts (MoE) et chain-of-thought
Contexte étendu : DeepSeek-Coder-V2 gère un contexte allant jusqu’à 128 000 tokens, idéal pour les documents longs .
4. Points forts
Modèles open source ou avec poids accessibles, ce qui favorise la recherche et l’innovation collaborative .
Rapport performance/coût exceptionnel, remettant en cause les approches ultra-coûteuses des grandes firmes .
Capacité à performer malgré les restrictions technologiques (exportation limitée de GPU vers la Chine) .
Adoption sectorielle notable, selon des sources communautaires : voitures, santé, finance, administrations locales en Chine utilisent déjà DeepSeek .
5. Limites & controverses
Censure politique intégrée : refuser de traiter des sujets sensibles en Chine (Tiananmen, droits des Ouïghours, statut de Taïwan…).
Sécurité et fiabilité : audit NewsGuard indique un taux d’échec de 83 % sur des sujets factuels .
Risques liés à la vie privée : données hébergées en Chine, possibles accès gouvernementaux, absence de transparence sur les pratiques de collecte . Plusieurs pays (États-Unis, Italie, Australie, EU, etc.) ont interdit DeepSeek sur les systèmes officiels .
6. En résumé
DeepSeek est une startup AI chinoise fondée en 2023, réputée pour ses modèles très performants (R1, V3), entraînés à faible coût et open source. Ces modèles excellent en codage, mathématiques et raisonnement avec des capacités de contexte étendues. Cependant, des limites majeures persistent : censure politique, failles de sécurité, préoccupations de confidentialité et réglementations internationales strictes.