Mistral dévoile Voxtral : une IA open source qui surpasse Whisper à moitié prix

Mais aussi : Mira Murati lève 2 milliards de dollars pour Thinking Machines Lab, Nvidia va reprendre les exportations de puces d'IA chinoises et plus encore.

Aujourd'hui:

  • Mistral dévoile Voxtral : une IA open source qui surpasse Whisper à moitié prix

  • Anthropic lance Claude AI pour les professionnels de la finance via AWS

  • Mira Murati lève 2 milliards de dollars pour son laboratoire Thinking Machines

  • Nvidia va reprendre ses exportations de puces d'IA en Chine

Ne restez pas à la traîne. Maîtrisez les dernières innovations en IA et propulsez votre carrière vers de nouveaux sommets. Inscrivez-vous maintenant et devenez un leader en IA.

49,00 €

Mistral AI lance Voxtral , deux modèles vocaux open source (24 milliards et 3 milliards de paramètres) sous licence Apache 2.0. Ils transcrivent des fichiers audio de 30 minutes, répondent aux questions, détectent les langues et déclenchent des actions à partir de commandes vocales. Les tests montrent qu'ils surpassent Whisper, GPT-4o mini et Gemini 2.5 Flash en termes de précision, tout en coûtant moitié moins cher. Un terminal optimisé ne coûte que 0,001 $ par minute, ce qui rend les interfaces vocales multilingues accessibles aux ordinateurs portables et aux périphériques.

Pourquoi c'est important

  1. Accès libre et de haute qualité – La reconnaissance et la compréhension vocales de premier ordre sont désormais libres d’utilisation et d’adaptation, réduisant ainsi les obstacles pour les startups et les chercheurs.

  2. Déploiement respectueux de la confidentialité – Le modèle plus petit peut fonctionner sur du matériel local, permettant aux hôpitaux, aux banques et aux appareils domestiques de conserver les données audio sensibles en interne.

  3. Passage de la voix à l’action – Des outils intégrés qui associent directement l’intention parlée aux commandes logicielles font progresser les assistants mains libres, les robots et les agents d’IA du monde réel.

Anthropic lance une version dédiée à la finance de son système Claude AI. Cette nouvelle solution d'analyse financière intègre les modèles Claude 4, des outils de codage et des fonctionnalités d'entreprise pour permettre aux banquiers et aux investisseurs d'étudier les marchés, d'analyser les rapports et de concevoir des logiciels plus rapidement. Elle exploite les données en temps réel de Box, PitchBook, S&P Global et d'autres acteurs, et commercialise ses produits via Amazon Web Services, et bientôt Google Cloud. Cette initiative illustre la volonté d'Anthropic de faire de son chatbot un partenaire de recherche.

Pourquoi c'est important

  1. IA spécifique à l’industrie – Claude est désormais pré-formé pour la finance, montrant comment de grands modèles sont adaptés pour résoudre les tâches quotidiennes de domaines spécialisés.

  2. Données réglementées en temps réel – Des liens directs vers des flux financiers fiables propulsent l’IA générative dans un secteur fortement réglementé, prouvant qu’elle peut répondre à des exigences strictes en matière de précision et de confidentialité.

  3. Distribution axée sur le cloud – La vente via AWS et Google Cloud signale une concurrence féroce pour intégrer des assistants IA dans les flux de travail commerciaux traditionnels.

Mira Murati, ancienne directrice technique et PDG par intérim d'OpenAI, a levé 2 milliards de dollars pour sa propre entreprise, Thinking Machines Lab. Parmi ses investisseurs figurent a16z, Nvidia, AMD, ServiceNow, Cisco, Jane Street et Accel. La startup prévoit de dévoiler un produit d'IA multimodal, capable de gérer le texte, la parole et la vision, dans les prochains mois. Une partie du système sera open source, et Murati s'engage à diffuser prochainement les outils d'IA de manière équitable auprès des entreprises et des communautés du monde entier.

Pourquoi c'est important

  1. Nouvelle concurrence – Un nouveau laboratoire bien financé défie les géants actuels, accélérant l’innovation et réduisant le contrôle des monopoles.

  2. Promesse de science ouverte – Le partage de code et de recherche peut permettre aux universités, aux startups et au public d’inspecter et d’améliorer des modèles puissants.

  3. Focus multimodal – Une technologie qui comprend les mots, les sons et les images ensemble ouvre la voie à une interaction homme-machine plus fluide et à des applications entièrement nouvelles.

🧠 RECHERCHE

Open Vision Reasoner (OVR) optimise le raisonnement visuel en IA en imitant l'apprentissage des modèles linguistiques grâce à un entraînement basé sur la récompense. Grâce à une méthode en deux étapes (affinement initial du langage, puis renforcement image-texte), le modèle obtient d'excellents résultats aux tests de mathématiques et de logique. Il démontre qu'un entraînement précoce façonne déjà des schémas de pensée visuelle utiles.

VFMTo est un nouveau générateur de jetons d'images basé sur des modèles de vision figée. Il améliore la génération d'images en préservant les détails visuels clés et en réduisant la répétition des données. Cela permet d'obtenir des images plus nettes, un apprentissage plus rapide et une utilisation efficace des jetons, permettant d'obtenir d'excellents résultats lors des tests de performance sans nécessiter d'assistance supplémentaire. La publication du code est prévue.

Cet article remet en question les récentes affirmations concernant l'amélioration du raisonnement de l'IA par l'apprentissage par renforcement. Il révèle que certains résultats pourraient être peu fiables en raison de fuites de données d'entraînement dans les ensembles de tests. S'appuyant sur un nouvel ensemble de données épuré, l'étude montre que seuls des signaux de récompense précis sont réellement efficaces. Elle préconise de meilleurs benchmarks et des tests plus approfondis pour garantir la fiabilité.

📲 RÉSEAUX SOCIAUX

🗞️PLUS D'ACTUALITÉS

  • Nvidia reprendra la vente de ses puces d'IA à la Chine après que les États-Unis ont accepté d'accorder des licences d'exportation. Cette décision annule une interdiction antérieure et apaise les tensions commerciales. La Chine demeure un marché vital pour les ambitions de Nvidia en matière d'IA.

  • Google investira 25 milliards de dollars dans l'IA et les centres de données du plus grand réseau électrique des États-Unis. L'entreprise modernisera également les centrales hydroélectriques de Pennsylvanie pour répondre à la demande énergétique, soutenant ainsi la croissance de l'IA et les besoins en infrastructures .

  • Lors d'un sommet à Pittsburgh, Trump a célébré 90 milliards de dollars d'investissements dans l'IA et l'énergie, notamment d'importants projets de centres de données de Google, Blackstone et CoreWeave. Son administration a donné la priorité à la victoire dans la course à l'IA plutôt qu'aux préoccupations climatiques, assouplissant la réglementation énergétique pour accélérer le développement des États-Unis.

  • Velvet Sundown , un groupe créé par l'IA , a cumulé plus d'un million d'écoutes sur Spotify avant de révéler que ses chansons, ses images et son histoire étaient entièrement créées par l'IA. Cette révélation a suscité des appels à la légalisation des labels musicaux créés par l'IA, soulevant des inquiétudes quant à la transparence, aux droits d'auteur et à l'équité envers les artistes humains.

  • Des chercheurs de renom d'OpenAI, Google DeepMind, Anthropic et Meta préviennent que les modèles d'IA pourraient bientôt perdre leur capacité à révéler leurs processus de pensée. Les systèmes actuels révèlent le raisonnement interne du langage humain, offrant une transparence rare, mais cette transparence pourrait disparaître avec l'émergence de méthodes plus avancées et plus opaques. 

  • Calvin French-Owen, ancien ingénieur d'OpenAI, a partagé un aperçu sincère de l'entreprise, décrivant une croissance chaotique, des efforts redondants et une ambiance de startup décousue malgré sa taille. Il a salué la rapidité et l'impact du produit, notamment le lancement rapide de Codex, mais a souligné le secret et la qualité inégale du code. Contrairement à l'opinion publique, il a déclaré qu'OpenAI prend la sécurité au sérieux, se concentrant moins sur les risques liés à la science-fiction et davantage sur les abus dans le monde réel, comme les discours de haine et les menaces d'armes biologiques. 

🎬DERNIÈRES VIDÉOS