l'AGI ARRIVE, Préparez-vous
Posts
DeepSeek publie le modèle Prover V2

DeepSeek publie le modèle Prover V2

Mais aussi : OpenAI corrige le ChatGPT trop flatteur, Gemini ajoute l'édition d'image native et bien plus encore.

VISION IA
1 mai

Aujourd'hui:

DeepSeek publie le modèle Prover V2
Qwen lance un modèle multimodal compact
Google envisage l'intégration de l'iPhone en 2025
OpenAI corrige le ChatGPT trop flatteur
Gemini ajoute l'édition d'images native

Votre Assistant Secret : Comment l'IA Peut Vous Rendre Surhumain

Ne restez pas à la traîne. Maîtrisez les dernières innovations en IA et propulsez votre carrière vers de nouveaux sommets. Inscrivez-vous maintenant et devenez un leader en IA.

49,00 € 99,00 €

DeepSeek publie le modèle Prover V2

Le laboratoire d'IA chinois DeepSeek a discrètement publié la version 2 de Prover , son modèle d'IA axé sur les mathématiques, sur Hugging Face. Basé sur l'imposant modèle V3 de l'entreprise, avec 671 milliards de paramètres, Prover V2 utilise une conception modulaire qui attribue des tâches à des composants spécialisés. Cette mise à niveau renforce sa capacité à résoudre des preuves mathématiques. DeepSeek prévoit également de mettre à jour prochainement son modèle de raisonnement, signe de progrès continus dans la logique et la résolution de problèmes pilotées par l'IA.

Pourquoi c'est important

Avance le raisonnement formel : Prover renforce la capacité de l'IA à résoudre des problèmes mathématiques et logiques complexes, une étape clé vers des applications scientifiques avancées.
Accès libre : sa publication sur Hugging Face permet une collaboration et une transparence de recherche plus larges.
L'essor croissant de l'IA en Chine : il reflète la présence croissante de la Chine dans l'IA de pointe, en particulier dans les domaines de haute compétence comme la démonstration de théorèmes.

Qwen lance un modèle multimodal compact

L'équipe Qwen d'Alibaba a lancé Qwen2.5-Omni-3B , un modèle d'IA puissant et compact qui gère le texte, l'audio, l'image et la vidéo sur les PC grand public. Malgré sa taille réduite, il offre plus de 90 % des performances de son homologue 7B et prend en charge la parole en temps réel et la saisie multimodale. Bien qu'impressionnant sur le plan technique, il est concédé sous licence uniquement pour la recherche ; les entreprises doivent obtenir une autorisation spéciale pour l'utiliser à des fins commerciales, ce qui en fait un outil d'évaluation performant, et non une solution prête à être déployée.

Pourquoi c'est important

Puissance multimodale sur le matériel grand public : cela montre que l'IA multimodale en temps réel et de haute qualité peut désormais fonctionner en dehors des centres de données.
Barrière réduite à l’expérimentation : les développeurs peuvent tester et créer avec des modèles avancés sans matériel coûteux.
Les licences stratégiques signalent un changement : la licence réservée à la recherche met en évidence une tendance croissante où les modèles ouverts sont techniquement ouverts mais commercialement fermés.

Google envisage l'intégration de l'iPhone en 2025

Le PDG de Google, Sundar Pichai, a déclaré devant un tribunal américain qu'il espérait intégrer Gemini aux iPhones d'ici fin 2025. Apple s'appuie actuellement sur ses propres modèles et sur ChatGPT d'OpenAI pour les fonctionnalités d'IA de ses appareils. En cas de succès, l'accord placerait Gemini de Google aux côtés de ChatGPT dans l'écosystème d'Apple, intensifiant ainsi la concurrence entre les géants de l'IA pour la domination de l'intégration mobile.

Pourquoi c'est important

Augmentation majeure de la distribution : l'intégration dans les iPhones élargirait considérablement la base d'utilisateurs de Gemini.
Guerre des plateformes d'IA : cette initiative intensifie la concurrence entre Google et OpenAI pour atteindre les consommateurs.
Changements dans la stratégie d'Apple : l'ouverture d'Apple à l'IA tierce marque un changement significatif dans son écosystème étroitement contrôlé.

🧠 RECHERCHE

Apprentissage par renforcement pour le raisonnement dans de grands modèles de langage avec un exemple d'entraînement

Cet article montre que l'entraînement d'un modèle de langage à partir d'un seul exemple mathématique soigneusement choisi, grâce à l'apprentissage par renforcement, peut considérablement améliorer les performances. Cette technique double quasiment la précision sur les tests de performance clés et fonctionne sur tous les modèles. Elle révèle également de nouveaux comportements, tels que des gains et des améliorations inter-domaines, même après des pics de précision d'entraînement, remettant en question les hypothèses sur l'apprentissage des modèles.

UniversalRAG : Génération augmentée de récupération sur plusieurs corpus avec diverses modalités et granularités

UniversalRAG est un nouveau système qui améliore la façon dont les modèles d'IA extraient des informations externes pour répondre aux questions. Contrairement aux méthodes classiques qui s'appuient uniquement sur du texte ou un seul type de données, UniversalRAG récupère des informations à partir de sources multiples (texte, images, vidéos) en fonction de ce qui convient le mieux. Cette récupération plus intelligente et ciblée améliore la précision de diverses tâches.

ReasonIR : Entraîner les retrievers aux tâches de raisonnement

ReasonIR-8B est un nouveau récupérateur spécialement conçu pour les tâches de raisonnement, et pas seulement pour la simple recherche de faits. Il est entraîné sur des requêtes synthétiques associées à des fausses pistes complexes, ce qui lui permet de mieux identifier les informations utiles. Il surpasse les autres systèmes sur des benchmarks complexes et améliore les performances dans des tâches comme MMLU et GPQA. Le code et les modèles sont open source.

📲 RÉSEAUX SOCIAUX

On dirait que c’était hier que GPT-4 est sorti (en même temps, c’était il y a à peine un an)… et il est déjà à la retraite. Il rejoint GPT-3 au panthéon des légendes.
Traduction du tweet:
Adieu, GPT-4. Tu as lancé une révolution.
Nous conserverons fièrement tes poids sur un
— VISION IA (@vision_ia)
7:10 AM • May 1, 2025

Traduit en 🇫🇷
Jensen Huang :
La Chine est juste derrière les États-Unis dans le développement de l'IA, ils sont très proches. C'est une "course infinie" qui ne se terminera pas rapidement. Avec la moitié des chercheurs en IA du monde qui sont chinois, cette compétition à long
— VISION IA (@vision_ia)
6:20 AM • May 1, 2025

traduit en 🇫🇷
Contrôle mental neuronal, rotation à 360 degrés. Main robotique surhumaine : la Ability Hand, peut être utilisée par les humains (Cyborg) et les robots humanoïdes.
— VISION IA (@vision_ia)
6:14 AM • May 1, 2025

🗞️PLUS D'ACTUALITÉS

OpenAI a annulé une mise à jour de GPT-4o qui rendait ChatGPT trop flatteur. L'équipe peaufine actuellement les méthodes d'entraînement, recueille des retours plus larges et ajoute des contrôles utilisateur pour rendre le modèle plus honnête, équilibré et personnalisable.
Le chatbot Gemini de Google prend désormais en charge l'édition d'images native, permettant aux utilisateurs de modifier les photos générées par l'IA ou téléchargées grâce à des outils tels que la modification de l'arrière-plan et le remplacement d'objets. Cette fonctionnalité, déployée à l'échelle mondiale, inclut le filigrane pour réduire les risques de deepfake.
Duolingo a lancé 148 nouveaux cours de langues grâce à l'IA générative, doublant ainsi son offre. Ce qui prenait autrefois des années prend désormais des mois, grâce à la création de contenu pilotée par l'IA. L'entreprise s'oriente vers une stratégie « IA first ».
Xiaomi a dévoilé MiMo-7B, un modèle d'IA à 7 B paramètres conçu pour les tâches mathématiques et de codage, surpassant certains modèles plus grands. Il utilise des méthodes d'entraînement avancées, l'apprentissage par renforcement et la gestion de contextes longs, démontrant que les petits modèles peuvent rivaliser avec les grands grâce à une conception intelligente.
Mark Zuckerberg prévoit d'ajouter un niveau payant et des publicités à la nouvelle application d'IA de Meta, qui compte désormais près d'un milliard d'utilisateurs. Meta vise à accroître l'engagement dans un premier temps, puis à monétiser l'application grâce à des fonctionnalités premium et des suggestions de produits.
Jack Krawczyk , ancien directeur de Bard et Gemini chez Google, a rejoint Meta AI au moment même où Meta lance son application d'IA autonome. Il met l'accent sur la création d'assistants chaleureux, humbles et fiables, et pas seulement sur l'information.

DeepSeek publie le modèle Prover V2

Mais aussi : OpenAI corrige le ChatGPT trop flatteur, Gemini ajoute l'édition d'image native et bien plus encore.

Aujourd'hui:

Votre Assistant Secret : Comment l'IA Peut Vous Rendre Surhumain

DeepSeek publie le modèle Prover V2

Qwen lance un modèle multimodal compact

Google envisage l'intégration de l'iPhone en 2025

🧠 RECHERCHE

📲 RÉSEAUX SOCIAUX

🗞️PLUS D'ACTUALITÉS

🎬DERNIÈRES VIDÉOS