Google DeepMind lance Nano Banana Pro avec texte multilingue et édition intelligente

Perplexity lance Comet AI Browser sur Android, l’application Gemini ajoute la vérification d’images pour repérer les photos générées par l’IA et plus encore.

Aujourd'hui:

  • Google DeepMind lance Nano Banana Pro avec texte multilingue et édition intelligente

  • OpenAI lance ChatGPT gratuit pour les enseignants américains du primaire et du secondaire

  • Perplexity lance Comet AI Browser sur Android

  • L'application Gemini ajoute la vérification d'images pour détecter les photos générées par l'IA

Become An AI Expert In Just 5 Minutes

If you’re a decision maker at your company, you need to be on the bleeding edge of, well, everything. But before you go signing up for seminars, conferences, lunch ‘n learns, and all that jazz, just know there’s a far better (and simpler) way: Subscribing to The Deep View.

This daily newsletter condenses everything you need to know about the latest and greatest AI developments into a 5-minute read. Squeeze it into your morning coffee break and before you know it, you’ll be an expert too.

Subscribe right here. It’s totally free, wildly informative, and trusted by 600,000+ readers at Google, Meta, Microsoft, and beyond.

Nano Banana Pro est une mise à jour majeure du générateur d'images de Google DeepMind. Il crée désormais des visuels plus précis avec du texte lisible, des connaissances approfondies et des outils d'édition intelligents. Les utilisateurs peuvent réaliser des infographies, des affiches ou des maquettes en plusieurs langues, ajuster l'éclairage, fusionner jusqu'à 14 images et vérifier l'origine de l'IA grâce à SynthID.

POINTS CLÉS

  • Des visuels plus intelligents : Génère des images détaillées et réalistes grâce à la connaissance du monde et à un meilleur raisonnement du Gemini 3 Pro.

  • Texte dans les images : Affiche un texte stylisé et lisible en plusieurs langues, idéal pour les infographies, l’image de marque et la traduction.

  • Contrôle créatif : Permet aux utilisateurs de modifier l'éclairage, la mise au point, la mise en page et les personnages – idéal pour les designers, les enseignants et les spécialistes du marketing.

Pourquoi c'est important

Nano Banana Pro offre aux utilisateurs, particuliers comme professionnels, des outils performants pour transformer leurs idées en images claires et esthétiques. Il allie design, informations et narration d'une manière autrefois réservée aux logiciels experts. De plus, le filigrane intégré permet d'identifier les créations générées par IA.

ChatGPT pour enseignants est une version gratuite et privée de ChatGPT conçue pour les enseignants du primaire et du secondaire aux États-Unis. Elle leur permet de gagner du temps, de personnaliser leur enseignement et de collaborer avec leurs collègues. Elle offre GPT-5.1, des outils d'administration et une protection des données de niveau scolaire, et est disponible gratuitement jusqu'en juin 2027.

POINTS CLÉS

  • Conçu pour les enseignants : Offre une planification de cours personnalisée, une gestion des données sécurisée pour les élèves et des intégrations d'outils (Google Drive, Canva, etc.).

  • Gratuit jusqu'en 2027 : Les enseignants américains de la maternelle à la terminale peuvent l'utiliser gratuitement, avec des fonctionnalités avancées comme GPT-5.1 et le téléchargement de fichiers.

  • Assistance administrative et politique : Les contrôles à l’échelle du district, la sécurité SSO et les ressources d’initiation à l’IA favorisent une adoption sûre et évolutive.

Pourquoi c'est important

Les enseignants sont constamment soumis à la pression du temps. Cet outil leur offre un soutien fiable en IA pour planifier leurs cours, adapter leurs supports pédagogiques et faire preuve de créativité sans compromettre la sécurité des données des élèves. En le proposant gratuitement, OpenAI rend l'IA puissante plus accessible à l'éducation publique, permettant ainsi aux enseignants d'ouvrir la voie.

Perplexity lance son navigateur Comet, basé sur l'IA, sur Android , offrant aux utilisateurs mobiles la recherche vocale, des résumés d'onglets et une assistance intégrée. Si certaines fonctionnalités de bureau, comme la synchronisation, ne sont pas encore disponibles, des améliorations majeures telles que le mode vocal interactif et la gestion des mots de passe seront bientôt proposées.

POINTS CLÉS

  • Navigateur IA mobile : Comet est désormais disponible sur Android, avec l’assistant intégré de Perplexity pour une interaction web en temps réel.

  • Mode vocal et résumés : les utilisateurs peuvent poser des questions à voix haute et obtenir des résumés instantanés du contenu des onglets.

  • Nouvelles fonctionnalités à venir : la synchronisation des favoris, des agents vocaux complets et un gestionnaire de mots de passe sont en cours de développement.

Pourquoi c'est important

Les navigateurs intégrant l'IA, comme Comet, révolutionnent notre façon de naviguer sur le web. Grâce à l'accès mobile et à l'intégration vocale, Perplexity offre aux utilisateurs une expérience mains libres pour apprendre, faire des recherches et interagir avec le contenu, préfigurant un avenir où la navigation deviendra une conversation dynamique.

🧠 RECHERCHE

Kandinsky 5.0 est une nouvelle famille de modèles open source permettant de créer des images de haute qualité et des vidéos de 10 secondes. Elle comprend des versions légères et puissantes, entraînées avec des techniques avancées pour optimiser la vitesse et la qualité. Cette version inclut du code et des points de contrôle pour aider les chercheurs à concevoir et expérimenter des outils de génération visuelle rapides et haute résolution.

VR-Bench est un nouveau test de performance qui évalue la capacité des modèles vidéo à résoudre des labyrinthes en analysant l'espace et en planifiant les étapes. L'étude révèle que les modèles vidéo surpassent les autres systèmes d'IA et que leurs performances s'améliorent encore grâce à des tests variés. Ce test est très prometteur pour le raisonnement visuel à partir de la vidéo.

AraLingBench est un banc d'essai qui évalue la capacité des modèles de langage IA à comprendre l'arabe. À partir de 150 questions rédigées par des experts, il vérifie la grammaire, l'orthographe, la compréhension écrite et la structure des phrases. Les résultats montrent que si les modèles obtiennent souvent de bons résultats en surface, ils peinent à une compréhension plus profonde, s'appuyant davantage sur la reconnaissance de formes que sur une véritable compréhension linguistique.

📲 RÉSEAUX SOCIAUX

🗞️PLUS D'ACTUALITÉS

  • Google intègre la vérification d'images à l'application Gemini, permettant ainsi aux utilisateurs de vérifier si une photo a été créée ou modifiée avec l'IA de Google. Cela facilite la détection des contenus générés par l'IA et renforce la confiance dans ce que les utilisateurs voient .

  • GPT-5 aide les scientifiques à travailler plus rapidement. Lors des premières expériences, il a permis de découvrir des mécanismes immunitaires insoupçonnés, de finaliser des démonstrations mathématiques et de relier des recherches interdisciplinaires. Bien qu'imparfait, associé à des experts, il accélère les découvertes.

  • Le projet de décret présidentiel de Trump empêcherait les États d'adopter leurs propres lois sur l'IA. Il prévoit des poursuites judiciaires contre des États comme la Californie et le Colorado, menace de couper les financements fédéraux et préconise une politique nationale unique en matière d'IA favorisant les entreprises technologiques.

  • ChatGPT prend désormais en charge les discussions de groupe à l'échelle mondiale. Jusqu'à 20 utilisateurs peuvent collaborer sur des conversations partagées, quel que soit leur abonnement. Cette fonctionnalité transforme ChatGPT, d'un assistant individuel, en un espace convivial et collaboratif pour la planification, la rédaction et la prise de décision.

  • Google DeepMind a recruté Aaron Saunders, ancien directeur technique de Boston Dynamics, pour diriger le développement du matériel robotique. L'objectif : faire de Gemini l'équivalent d'Android pour les robots, une plateforme d'IA compatible avec tous les types de robots, des humanoïdes aux machines aux formes spécialisées.

  • ChatGPT Atlas propose désormais des onglets verticaux de type Arc et permet de définir Google comme moteur de recherche par défaut. Cette mise à jour améliore la gestion des onglets, ajoute le glisser-déposer et optimise l'importation des extensions, rapprochant ainsi ce navigateur IA d'une véritable plateforme de productivité.

  • OLMo 3 est le premier modèle d'IA « pensant » entièrement ouvert, dévoilant sa logique pas à pas et l'intégralité de son processus d'apprentissage. Développé par l'Allen Institute for AI, il est performant, transparent et rivalise avec des modèles plus complexes en matière de raisonnement, de programmation et de compréhension.

  • L'intelligence artificielle Gemini de Google est désormais disponible sur Android Auto, remplaçant ainsi l'Assistant Google dans les voitures. Les conducteurs peuvent utiliser les commandes vocales pour envoyer des messages, se repérer, consulter leur calendrier ou simplement discuter, tout en gardant les mains sur le volant. Offre non disponible pour les utilisateurs iOS.

🎬DERNIÈRES VIDÉOS