- l'AGI ARRIVE, Préparez-vous
- Posts
- DeepSeek V3 Surpasse ses Rivaux en IA
DeepSeek V3 Surpasse ses Rivaux en IA
EN PLUS : Le test ARC-AGI-2 déconcerte l’IA, Midjourney se lance dans l’écriture IA et bien plus encore.

Bonjour à tous les passionnés d'IA & Tech,
Bienvenue dans ce premier numéro de la Newsletter Vision IA, où nous explorons cette semaine comment la Chine bouscule l'écosystème de l'IA avec DeepSeek V3 et les avancées d'Ant Group. Découvrez également pourquoi le nouveau test ARC-AGI-2 remet en question notre compréhension de l'intelligence artificielle.
Bonne lecture et n'hésitez pas à me faire part de vos retours en répondant directement à cet email !
Vision IA
Aujourd'hui:
![]() | Ne restez pas à la traîne. Maîtrisez les dernières innovations en IA et propulsez votre carrière vers de nouveaux sommets. Inscrivez-vous maintenant et devenez un leader en IA. 49,00 € 99,00 € |
La startup chinoise d'IA DeepSeek a lancé DeepSeek-V3-0324 , un modèle de 641 Go fonctionnant efficacement sur du matériel grand public haut de gamme comme le Mac Studio d'Apple. Sa licence open source MIT remet en question les modèles fermés des entreprises d'IA occidentales. Grâce à une architecture mixte d'experts, elle active uniquement les paramètres pertinents, ce qui la rend plus rapide et plus efficace. Cette version marque un tournant dans le déploiement de l'IA, privilégiant l'accès ouvert et l'efficacité par rapport à l'approche traditionnelle, coûteuse et basée sur le cloud.

Pourquoi c'est important pour l'IA
Perturbation open source – Le modèle de DeepSeek sous licence MIT remet en question la domination des écosystèmes d'IA fermés comme celui d'OpenAI, rendant l'IA de pointe plus accessible.
IA efficace sur du matériel grand public – L’exécution d’un modèle puissant localement sur un Mac Studio réduit la dépendance aux GPU coûteux basés sur le cloud, redéfinissant ainsi l’infrastructure de l’IA.
L’essor de l’IA en Chine – L’avancée rapide des modèles d’IA chinois, qui rivalisent désormais avec leurs homologues occidentaux, accélère la concurrence et l’innovation mondiales en matière d’IA.
Ant Group, soutenu par Jack Ma, a développé une technique d'entraînement de l'IA utilisant des puces chinoises d'Alibaba et de Huawei, réduisant ainsi les coûts de 20 %. Grâce à l'approche « Mixture of Experts » (MoE), leurs modèles ont obtenu des résultats comparables à ceux des puces H800 de Nvidia. Cette avancée marque une étape importante dans l'indépendance de la Chine en matière d'IA, remettant en cause la domination de Nvidia et mettant en évidence les capacités croissantes de la technologie nationale des semi-conducteurs.

Pourquoi c'est important pour l'IA
Indépendance de l’IA – Le succès de la Chine dans la formation de modèles d’IA avec des puces nationales réduit la dépendance à l’égard de Nvidia et des technologies occidentales.
Efficacité des coûts – Une réduction de 20 % des coûts de formation rend le développement de l’IA plus accessible et évolutif.
Innovation compétitive en matière d’IA – L’utilisation de modèles MoE démontre les progrès de la Chine dans l’optimisation des performances de l’IA avec des ressources limitées.
OpenAI a mis à jour son mode vocal avancé dans ChatGPT, rendant l'assistant IA plus engageant et moins perturbateur . Cette mise à jour réduit les interruptions inutiles lorsque les utilisateurs marquent une pause et améliore les réponses pour qu'elles soient plus directes, concises et créatives . Les utilisateurs gratuits et payants en bénéficient, tandis que les abonnés premium bénéficient de fonctionnalités de personnalisation améliorées. Ces mises à jour interviennent dans un contexte de concurrence accrue , avec des startups comme Sesame et des acteurs majeurs comme Amazon qui développent des assistants vocaux IA.
Pourquoi c'est important pour l'IA
Expérience utilisateur améliorée – Un assistant IA plus naturel et réactif améliore les conversations en temps réel.
Concurrence croissante – OpenAI fait face à une pression croissante de la part des startups et des géants de la technologie qui développent leurs propres assistants vocaux.
Évolution de la voix de l’IA – Les progrès de l’IA conversationnelle signalent une évolution vers des assistants numériques plus humains .
🧠 RECHERCHE
Cet article explore la réduction du nombre de jetons visuels dans les modèles de traitement d'images afin de réduire les coûts de calcul tout en préservant la précision. Les auteurs présentent une méthode qui sélectionne uniquement les jetons les plus utiles. Les tests montrent que plus de 50 % des jetons peuvent être supprimés avec un impact minimal, ce qui suggère une approche plus efficace de la représentation des images.
Cet article propose d'utiliser la vidéo générée par l'IA comme cœur des futurs moteurs de jeu, permettant ainsi la création illimitée de contenu interactif. Les auteurs présentent un cadre pour les moteurs de jeu génératifs (GGE), soulignant leur potentiel en termes de réalisme, de modélisation physique et de contrôle du joueur. Cette approche pourrait transformer le développement de jeux en réduisant les coûts et en stimulant la créativité.
MAPS : l'équipe d'IA qui résout des problèmes scientifiques complexes en posant les bonnes questions
MAPS est un système d'IA multi-agents conçu pour résoudre des problèmes scientifiques complexes à l'aide de multiples types de données, comme du texte et des diagrammes. Il utilise sept agents spécialisés et le questionnement socratique pour améliorer le raisonnement et la réflexion. MAPS surpasse les modèles existants de 15,84 %, démontrant une meilleure résolution de problèmes et une meilleure adaptabilité à divers ensembles de données.
L'échantillonnage en goulot d'étranglement est une méthode permettant d'accélérer les images et vidéos générées par l'IA sans réentraînement. En traitant à des résolutions plus faibles lors des étapes intermédiaires, cette méthode réduit les coûts de calcul tout en préservant la qualité. Les tests montrent une génération d'images jusqu'à 3 fois plus rapide et une génération de vidéos jusqu'à 2,5 fois plus rapide, avec des résultats comparables aux méthodes pleine résolution.
Cet article explore l'utilisation de modèles d'IA multimodaux (MLLM) comme juges pour évaluer le contenu généré par l'IA dans différents formats, tels que les images, l'audio et la vidéo. Les auteurs introduisent des critères de référence pour évaluer la précision et l'équité de ces modèles. Les résultats montrent qu'ils sont performants dans la compréhension des tâches, mais qu'ils peinent à générer des résultats, révélant des biais et des hallucinations.
🗞️PLUS D'ACTUALITÉS
Un nouveau test d'IA, ARC-AGI-2 , met au défi les modèles d'IA avec des tâches de reconnaissance de formes inédites. La plupart des modèles phares obtiennent des résultats d'environ 1 %, bien inférieurs à ceux des humains. Ce test met l'accent sur l'efficacité et vise à mesurer l'intelligence réelle au-delà de la puissance de calcul brute.
Midjourney , réputé pour sa génération d'images par IA, se lance dans l'IA textuelle. En partenariat avec l'Université de New York, l'entreprise a développé des techniques pour stimuler la créativité en rédaction IA. Ces méthodes améliorent la diversité narrative, au bénéfice des créateurs de contenu, des marketeurs et des développeurs IA.
OpenAI a restructuré sa direction, renforçant le rôle du directeur de l'exploitation Brad Lightcap, tandis que le PDG Sam Altman se concentre sur la recherche et les produits. Parmi les nouvelles promotions, on compte Mark Chen au poste de directeur de la recherche et Julia Villagra au poste de directrice des ressources humaines.
Thrive Capital investit 40 millions de dollars dans la start-up d'IA Rogo, la valorisant jusqu'à 350 millions de dollars. Rogo, qui développe des logiciels d'IA pour les analystes et les banquiers de Wall Street, utilise OpenAI et les modèles anthropiques pour automatiser la recherche financière. Les investisseurs constatent une forte demande pour ces outils dans le secteur financier.
Google déploie des fonctionnalités vidéo IA en temps réel pour Gemini, lui permettant de « voir » les écrans et les flux de caméras. Disponible pour certains abonnés Google One AI Premium, cette fonctionnalité permet à Gemini d'analyser les visuels et de répondre aux questions en temps réel.
Microsoft lance 11 agents de sécurité basés sur l'IA pour automatiser les tâches répétitives de cybersécurité, réduire l'épuisement professionnel des analystes et améliorer l'efficacité. Ces agents gèrent la détection du phishing, les notifications réglementaires et bien plus encore, offrant une autonomie configurable et une supervision humaine.