DeepSeek dévoile son modèle AI V4 et la quête des modèles du monde

DeepSeek, entreprise chinoise spécialisée en intelligence artificielle, a présenté son modèle V4, capable de traiter des prompts beaucoup plus longs. Cette avancée marque un tournant dans le paysage concurrentiel de l’IA, rivalisant avec des géants comme OpenAI et Google.

Le vendredi dernier, DeepSeek a lancé un aperçu de son dernier modèle phare, V4, qui promet de transformer le domaine de l’intelligence artificielle. Ce modèle, qui fait partie des avancées les plus attendues dans le secteur, se distingue par sa capacité à traiter des prompts nettement plus longs que sa génération précédente. Grâce à une conception innovante, il gère efficacement de grandes quantités de texte. Bien qu’il reste open source, ses performances se rapprochent de celles des modèles fermés de concurrents comme Anthropic, OpenAI et Google. Ce lancement est également significatif car V4 est optimisé pour fonctionner sur les puces Ascend de Huawei, ce qui représente un test crucial pour évaluer la dépendance de la Chine vis-à-vis de Nvidia.

Parallèlement à ces développements, un autre sujet d’importance émerge : les modèles du monde. Les systèmes d’IA ont déjà démontré des compétences impressionnantes dans le monde numérique, mais le monde physique reste un défi. Concevoir une IA capable de plier du linge ou de naviguer dans des rues urbaines est bien plus complexe que de créer des algorithmes capables d’écrire des romans ou de coder des applications. Pour combler ce fossé, de nombreux chercheurs estiment qu’il est nécessaire de développer des modèles du monde. Des experts comme la professeure Fei-Fei Li de Stanford et le fondateur d’AMI Labs, Yann LeCun, soutiennent que ces modèles pourraient surmonter les limitations bien connues des modèles de langage (LLMs) et réaliser le potentiel de l’IA dans la robotique.

Ce sujet de recherche figure parmi les “10 choses qui comptent actuellement dans l’IA”, une liste essentielle à suivre dans le domaine. Pour approfondir ces sujets, les abonnés peuvent participer à une table ronde exclusive animée par des journalistes de MIT Technology Review.

Dans les nouvelles connexes, la Chine a récemment bloqué l’acquisition de l’entreprise d’IA Manus par Meta pour 2 milliards de dollars, citant des raisons de sécurité nationale et qualifiant la transaction de tentative “conspiratoire” de déstabiliser sa base technologique. Par ailleurs, Google a annoncé un investissement pouvant atteindre 40 milliards de dollars dans Anthropic, valorisant l’entreprise à 350 milliards de dollars, afin de soutenir ses besoins croissants en matière de calcul. Enfin, des préoccupations concernant des interférences politiques dans la science américaine sont apparues suite au licenciement de l’ensemble du National Science Board par le président Trump.

Source originale :
MIT Tech Review
— Article résumé et traduit automatiquement par IA.

Des reins super refroidis transplantés dans des porcs : une avancée majeure

Révolution dans la transplantation d’organes et avancées des puces chinoises

Préparation de lamelles TEM : la ZEISS Crossbeam 750 révolutionne l’analyse des semi-conducteurs