l'AGI ARRIVE, Préparez-vous
Posts
MedGemma : Google libère l’IA médicale gratuite (IRM, radios et texte)

MedGemma : Google libère l’IA médicale gratuite (IRM, radios et texte)

Mais aussi : Luma AI ouvre un laboratoire à Hollywood, Grok est lancé dans les voitures Tesla et plus encore.

VISION IA
11 juil.

Aujourd'hui:

Google lance les modèles de santé MedGemma
Gemini anime désormais vos photos
Luma AI ouvre un laboratoire à Hollywood
Lancement de Grok dans les voitures Tesla

Votre Assistant Secret : Comment l'IA Peut Vous Rendre Surhumain

Ne restez pas à la traîne. Maîtrisez les dernières innovations en IA et propulsez votre carrière vers de nouveaux sommets. Inscrivez-vous maintenant et devenez un leader en IA.

49,00 €

Google lance les modèles de santé MedGemma

Google a publié deux puissants modèles d'IA open source pour le secteur de la santé : MedGemma 27B Multimodal et MedSigLIP . Ces modèles gèrent à la fois le texte et les images médicales, facilitant ainsi des tâches telles que la génération de rapports et la classification d'images. Ils sont conçus pour garantir la confidentialité, la personnalisation et un déploiement efficace, même sur appareils mobiles. Les développeurs peuvent les adapter à leurs besoins spécifiques, ce qui les rend idéaux pour créer des applications médicales fiables et performantes, sans recourir à des API instables ni à des plateformes fermées.

Pourquoi c'est important

Améliore l'IA médicale open source
MedGemma offre aux développeurs des outils puissants et flexibles sans dépendre d'API propriétaires, essentiels pour la confidentialité et la stabilité à long terme.
Permet une IA de santé mobile et à faible coût
Ces modèles fonctionnent sur un seul GPU ou matériel mobile, réduisant ainsi les obstacles au déploiement mondial, en particulier dans les régions aux ressources limitées.
Améliore la transparence et la confiance de l'IA
L'accès ouvert au code, au format des données et aux principes de formation aide les chercheurs à valider, améliorer et appliquer en toute sécurité les systèmes d'IA de santé.

Gemini anime désormais vos photos

Google a lancé une nouvelle fonctionnalité d'IA Gemini qui transforme les photos en courtes vidéos grâce à son modèle Veo 3. Les utilisateurs peuvent télécharger une image et décrire le mouvement, les dialogues et le son pour générer une vidéo 720p de huit secondes avec images et son synchronisés. Cet outil, disponible pour les abonnés Ultra et Pro, inclut des filigranes IA visibles et invisibles. Il est désormais disponible sur le web et sur mobile dans certaines régions, élargissant ainsi les possibilités créatives des utilisateurs.

Pourquoi c'est important

Gemini permet aux utilisateurs d'
animer des images statiques avec de l'audio synchronisé, rendant la création vidéo plus accessible et intuitive.
Progrès de la génération multimodale
La mise à jour met en évidence la manière dont l'IA combine les entrées visuelles, audio et textuelles dans des sorties multimédias cohérentes.
Concurrence avec les plateformes d'IA créatives
Cette fonctionnalité met la pression sur des concurrents comme Runway et Pika en ajoutant des outils vidéo créatifs directement dans le produit d'IA principal de Google.

Luma AI ouvre un laboratoire à Hollywood

Luma AI ouvre Dream Lab LA , un espace créatif à Hollywood pour former les cinéastes à ses outils de génération vidéo. L'objectif est de combiner IA et divertissement, permettant aux créateurs de créer des scènes sans tournage traditionnel. L'outil Modify de Luma permet de transformer de simples séquences en scènes cinématographiques. Grâce à un financement important et à l'intérêt de l'industrie, Luma vise à révolutionner la production cinématographique : plus rapide, moins cher et plus flexible sur le plan créatif grâce à l'IA multimodale.

Pourquoi c'est important

Accélère la réalisation de films pilotés par l'IA
Luma intègre des outils vidéo d'IA en temps réel directement dans les pipelines de production hollywoodiens.
Réduit les barrières créatives
Les cinéastes peuvent désormais créer des scènes de haute qualité sans gros budgets ni décors, démocratisant ainsi la création de contenu.
Les laboratoires d'IA comme Dream Lab LA montrent à quel point l'IA générative s'intègre profondément dans les flux de travail des médias de base .

OpenAI va lancer le navigateur Web AI

OpenAI s'apprête à lancer son propre navigateur web basé sur l'IA pour concurrencer Google Chrome. Basé sur Chromium, il proposera des outils de chat et d'agent, permettant aux utilisateurs d'accéder à une interface de type ChatGPT pour effectuer des tâches telles que la réservation ou la recherche. OpenAI accède ainsi à de précieuses données utilisateurs, essentielles à l'activité publicitaire de Google. Cette initiative marque une intensification de l'influence de l'IA sur les technologies grand public, accentuant la pression dans la course à l'IA face à Google et à ses concurrents.

Pourquoi c'est important

Pouvoir d'accès aux données : posséder un navigateur donne à OpenAI un accès direct aux données de comportement des utilisateurs, essentielles pour la formation et l'amélioration des modèles d'IA.
Intégration des agents : le navigateur servira de plate-forme pour les agents d'IA, permettant l'exécution de tâches en temps réel comme la réservation ou les achats, marquant un pas vers des assistants numériques véritablement autonomes.
Défi direct à Google : l'entrée d'OpenAI sur le marché des navigateurs frappe Google à sa source même : les publicités, le trafic de recherche et le contrôle par défaut, ce qui pourrait remodeler l'équilibre des pouvoirs sur Internet.

🧠 RECHERCHE

Mise à l'échelle de RL pour les vidéos longues

Des chercheurs ont créé un système qui aide les modèles d'IA à mieux comprendre les longues vidéos en combinant l'entraînement, la réflexion étape par étape et l'apprentissage par renforcement. Leur modèle, LongVILA-R1, est performant sur des tâches vidéo complexes et rivalise même avec des modèles de pointe comme Gemini. L'équipe a également développé des outils permettant à d'autres d'entraîner efficacement des modèles similaires.

MIRIX : Système de mémoire multi-agents pour agents basés sur LLM

MIRIX est un nouveau système de mémoire pour agents IA qui les aide à mémoriser et à exploiter des informations complexes et durables. Il combine six types de mémoire et plusieurs agents pour gérer et récupérer les données. MIRIX améliore considérablement la précision des tâches complexes impliquant des visuels et des conversations, tout en utilisant beaucoup moins d'espace de stockage que les méthodes précédentes.

AutoTriton : Programmation automatique de Triton avec apprentissage par renforcement dans les LLM

AutoTriton est un modèle qui automatise l'écriture rapide de code GPU grâce à l'apprentissage par renforcement. Il apprend à optimiser les programmes Triton, utilisés pour l'apprentissage profond, en s'entraînant sur des exemples experts, puis en s'améliorant grâce aux retours d'expérience de l'exécution réelle du code. AutoTriton rivalise avec les meilleurs modèles d'IA en termes de performances, contribuant ainsi à la création de systèmes d'IA plus rapides et plus performants.

📲 RÉSEAUX SOCIAUX

🚨 ELON MUSK :
Vient d'annoncer que grok 4 heavy sera la premiere IA intégrée dans les Optimus pour commencer à incarner l'IA dans le monde physique. Wuaoh. Quelle époque. On va maintenant donner un corps à l'IA, une incarnation physique.
Musk: « On commence à manquer de
— VISION IA (@vision_ia)
2:00 PM • Jul 10, 2025

Une fois de plus, Elon Musk bouscule toute une industrie... Ne jamais parier contre Elon, reste toujours aussi vrai.
Donc Elon a :
- SpaceX
- Starlink
- Tesla
- X
- xAI / Grok
Comment diable il arrive à gérer tout ça tout en continuant à poster sur X ? Ce mec n'est pas réel.
— VISION IA (@vision_ia)
4:00 PM • Jul 10, 2025

Grok 4 a codé ça du premier coup 😅 Nous allons commencer à voir des test de plus en plus fou
Traduction du tweet original :
C’est incroyablement bon !
J’ai demandé : « Crée une animation d’une foule de personnes marchant pour former les mots “Hello world, I am Grok” pendant
— VISION IA (@vision_ia)
6:30 AM • Jul 11, 2025

🗞️PLUS D'ACTUALITÉS

Elon Musk a annoncé que Grok, le chatbot de xAI, serait intégré aux véhicules Tesla d'ici la semaine prochaine. Malgré les problèmes d'image de Tesla, Grok a évité la récente controverse et n'a pas été présenté lors de la dernière démonstration de sa nouvelle version.
La start-up d'IA Luma lance un laboratoire créatif à Hollywood pour aider les cinéastes à utiliser ses outils vidéo. Le studio formera les créateurs, favorisera la collaboration et intégrera les contenus générés par l'IA dans la production cinématographique et télévisuelle grand public .
AWS lancera la semaine prochaine une place de marché d' agents IA, permettant à des startups comme Anthropic de vendre des agents directement à leurs clients. Cette plateforme centrale vise à optimiser l'accès, à simplifier l'adoption et à concurrencer les plateformes similaires de Google et Microsoft.
Firebase Studio de Google inclut désormais trois modes d'IA basés sur Gemini : Demander, Agent et Exécution automatique de l'agent. Ces outils permettent aux développeurs de générer du code, de créer des applications et de connecter des sources de données avec un minimum d'intervention, tout en préservant la sécurité des projets.
Nvidia prévoit de lancer une puce d'IA spécifiquement destinée à la Chine d'ici septembre, contournant ainsi les restrictions d'exportation américaines. Basée sur un processeur Blackwell réduit, cette puce évite les fonctionnalités interdites tout en visant à reconquérir des parts de marché sur Huawei.
Indeed et Glassdoor vont supprimer 1 300 emplois suite au recentrage de Recruit, leur maison mère, sur l'IA. La plupart des suppressions d'emplois concernent les États-Unis, et les activités de Glassdoor fusionneront avec Indeed, ce qui entraînera des changements de direction et une consolidation accrue.

MedGemma : Google libère l’IA médicale gratuite (IRM, radios et texte)

Mais aussi : Luma AI ouvre un laboratoire à Hollywood, Grok est lancé dans les voitures Tesla et plus encore.

Aujourd'hui:

Votre Assistant Secret : Comment l'IA Peut Vous Rendre Surhumain

Google lance les modèles de santé MedGemma

Gemini anime désormais vos photos

Luma AI ouvre un laboratoire à Hollywood

OpenAI va lancer le navigateur Web AI

🧠 RECHERCHE

📲 RÉSEAUX SOCIAUX

🗞️PLUS D'ACTUALITÉS

🎬DERNIÈRES VIDÉOS