La société chinoise DeepSeek a lancé un aperçu de son modèle V4, marquant une étape importante dans l’IA. Ce modèle open source se distingue par sa capacité à traiter des prompts beaucoup plus longs et à un coût réduit.
Le vendredi dernier, la société d’IA chinoise DeepSeek a présenté un aperçu de son nouveau modèle phare, V4, tant attendu. L’une des caractéristiques les plus remarquables de ce modèle est sa capacité à traiter des demandes beaucoup plus longues que celles de la génération précédente, grâce à un nouveau design qui optimise le traitement de grandes quantités de texte. Comme pour les précédents modèles de DeepSeek, V4 est open source, ce qui signifie qu’il est accessible à quiconque souhaite le télécharger, l’utiliser ou le modifier. Ce lancement marque la sortie la plus significative de DeepSeek depuis R1, un modèle de raisonnement lancé en janvier 2025 qui avait déjà stupéfié l’industrie mondiale de l’IA par ses performances et son efficacité, propulsant DeepSeek au rang des meilleures entreprises d’IA en Chine en un temps record. Depuis lors, l’entreprise a maintenu un profil relativement bas, mais a récemment préparé le terrain pour V4 en introduisant des modes ‘expert’ et ‘flash’ sur sa version en ligne, suscitant des spéculations sur une sortie imminente. Toutefois, ce retour à la pointe des modèles d’IA fait suite à des mois de critiques, comprenant des départs de personnel, des retards de lancement, ainsi qu’une surveillance accrue des gouvernements américain et chinois. Alors, quelles sont les raisons qui rendent ce lancement important ? Premièrement, V4 ouvre de nouvelles perspectives pour les modèles open source. DeepSeek affirme que les performances de V4 rivalisent avec celles des meilleurs modèles disponibles, mais à une fraction du prix, ce qui est une excellente nouvelle pour les développeurs et les entreprises. V4 se décline en deux versions : V4-Pro, conçu pour les tâches complexes de codage, et V4-Flash, une version plus petite et plus rapide. Les tarifs de V4-Pro s’élèvent à 1,74 $ par million de tokens d’entrée et 3,48 $ par million de tokens de sortie, un coût bien inférieur à celui des modèles comparables d’OpenAI et Anthropic. Quant à V4-Flash, son coût est encore plus bas, à environ 0,14 $ par million de tokens d’entrée et 0,28 $ par million de tokens de sortie, en faisant l’un des modèles de premier plan les moins chers disponibles. En termes de performance, V4 représente une avancée majeure par rapport à R1, offrant une alternative solide aux derniers modèles d’IA. Selon les résultats partagés par l’entreprise, V4-Pro se mesure aux modèles fermés les plus performants, confirmant ainsi l’importance de cette sortie dans le paysage de l’IA.