- l'AGI ARRIVE, Préparez-vous
- Posts
- Qwen dévoile un nouvel outil d'image
Qwen dévoile un nouvel outil d'image
Mais aussi : Meta & Character.AI Face Child Safety Probe, Nvidia lance Nemotron-Nano-9B-v2 et plus encore.

Aujourd'hui:
Le nouvel outil d'image de Qwen permet d'échanger, de faire tourner et de styliser avec précision
Foxconn va gérer l'usine de serveurs d'IA Stargate de SoftBank dans l'Ohio
Meta & Character.AI face à une enquête sur la sécurité des enfants
Nvidia lance le Nemotron-Nano-9B-v2
Ne restez pas à la traîne. Maîtrisez les dernières innovations en IA et propulsez votre carrière vers de nouveaux sommets. Inscrivez-vous maintenant et devenez un leader en IA. 49,00 € |
Qwen-Image-Edit est un modèle amélioré qui permet à chacun de retoucher ou de transformer facilement des images. Il permet de modifier des objets, de les faire pivoter, de changer de style, d'ajouter ou de supprimer des parties, et de modifier du texte en anglais ou en chinois tout en conservant les polices. Le système associe un modèle de vision et un modèle de forme pour contrôler le sens et l'apparence, afin que les modifications restent fidèles à la scène. Les tests montrent qu'il surpasse tous les outils en termes de précision et de détail.

Pourquoi c'est important
Apporte un montage de niveau professionnel à tous : des invites simples remplacent des logiciels complexes, réduisant ainsi l'écart de compétences.
Fusionne le contrôle des images et du texte – La gestion transparente des mots et des visuels permet d'accéder à des modèles plus riches et véritablement multimodaux.
Augmente la barre des performances – Des résultats de pointe poussent les autres laboratoires à s’améliorer, accélérant ainsi les progrès des outils d’IA créatifs.
SoftBank va transformer l'ancienne usine de véhicules électriques de Foxconn, située dans l'Ohio, en un centre de production de serveurs d'IA pour son projet Stargate, d'un montant de 500 milliards de dollars, avec OpenAI et Oracle. Foxconn, sous le nom de Hon Hai, continue d'exploiter le site, tandis que SoftBank fournit les nouveaux équipements et les fonds. Une coentreprise fabriquera des équipements pour les centres de données, marquant ainsi la première usine en béton du programme de production de Stargate aux États-Unis et témoignant du renforcement des liens entre les États-Unis et l'Asie dans la course au matériel d'IA.
Pourquoi c'est important
Assure l'approvisionnement en matériel vital – les serveurs fabriqués aux États-Unis réduisent la dépendance aux usines étrangères, atténuant ainsi les pénuries de puces et de serveurs pour les entreprises d'IA.
Associer le savoir-faire asiatique à la demande américaine : les compétences de fabrication de Foxconn et le capital de SoftBank-OpenAI accélèrent l'infrastructure d'IA à grande échelle.
Des signaux de mégaprojets en plein essor – Un projet de construction de 500 milliards de dollars montre la confiance des investisseurs dans la croissance de l'IA et pousse les concurrents à égaler des paris aussi massifs.
Le procureur général du Texas, Ken Paxton, enquête sur AI Studio et Character.AI, filiales de Meta, accusées d'avoir présenté leurs chatbots comme des assistants en santé mentale, sans véritable soutien médical. Son enquête révèle que les robots attirent les enfants avec des profils de thérapeutes, enregistrent les conversations et exploitent les données pour des publicités tout en proposant des conseils génériques. Les deux entreprises publient des avertissements, mais les enfants peuvent les ignorer. Paxton a émis des injonctions légales pour obtenir des documents afin de déterminer si les entreprises ont enfreint les lois et réglementations de l'État en matière de protection des consommateurs.
Pourquoi c'est important
Appel au réveil réglementaire — Les gouvernements examinent de près les chatbots de santé mentale, imposant des déclarations plus claires et une surveillance professionnelle.
Pleins feux sur la confidentialité — Les enquêteurs se concentrent sur la manière dont les journaux de discussion alimentent les systèmes publicitaires et les données de formation, poussant à des normes de traitement des données plus strictes.
Pression de conception en matière de sécurité des enfants — Les développeurs doivent ajouter des barrières d'âge robustes et des fonctionnalités d'escalade de crise, façonnant ainsi la prochaine vague d'IA empathique.
🧠 RECHERCHE
DINOv3 est un puissant modèle de vision auto-apprenant qui fonctionne sans données étiquetées. Il s'adapte parfaitement aux grands ensembles de données, évite les pertes de qualité lors d'un apprentissage long et s'adapte facilement à différentes tâches. Il surpasse les anciens modèles dans de nombreuses tâches d'imagerie et offre des outils flexibles et performants pour diverses utilisations concrètes.
Le SSRL (Self-Search Reinforcement Learning) démontre que les grands modèles de langage (LLM) peuvent agir comme leurs propres moteurs de recherche pour les tâches d'apprentissage par renforcement. En entraînant les modèles à utiliser des connaissances internes plutôt que des outils externes, le SSRL améliore la précision, réduit les coûts et limite les erreurs. Il offre une solution stable et évolutive pour un entraînement plus intelligent des agents d'IA.
Thyme est un nouveau modèle d'IA qui apprend aux modèles de langage multimodaux à « penser au-delà des images » en exécutant du code pour manipuler des visuels et résoudre des problèmes. Il recadre, fait pivoter, améliore les images et effectue des calculs, tout seul. Grâce à un entraînement en deux étapes et à un algorithme d'apprentissage par renforcement personnalisé, Thyme améliore la précision du raisonnement et de la perception dans des tests rigoureux.
📲 RÉSEAUX SOCIAUX
Choses qui n’existaient pas il y a un mois :
- GPT-5
- GPT-5 mini
- GPT-5 nano
- GPT-OSS-120b
- GPT-OSS-20b
- Claude Opus 4.1
- Claude Sonnet 4.1
- Génie 3
- Google Deepthink advanced
- Google Gemma 270M
- Google Story book
- ChatGPT Agent
- Grok-4
- Grok Imagine
- Grok— VISION IA (@vision_ia)
9:00 AM • Aug 19, 2025
Il se passe quelque chose chez Google. Les chercheurs commencent à avoir une confiance absolue en l’entreprise…
Mais que nous préparent-ils ?
— VISION IA (@vision_ia)
6:41 AM • Aug 19, 2025
On ne vous le dit pas, mais les studios d’animation se mettent de plus en plus à utiliser l’IA.
Cette scène, par exemple, a été réalisée avec Hailuo. Mais les plus gros studios vont encore plus loin : ils entraînent déjà leurs propres IA en interne grâce à leurs immenses bases
— VISION IA (@vision_ia)
3:00 PM • Aug 18, 2025
🗞️PLUS D'ACTUALITÉS
Nvidia a lancé Nemotron-Nano-9B-v2, un modèle d'IA compact qui tient sur un seul GPU A10, prend en charge plusieurs langages et permet aux utilisateurs d'activer ou de désactiver le raisonnement. Rapide, précis, open source et prêt pour une utilisation commerciale, il est également disponible.
Grammarly a lancé neuf outils d'aide à la rédaction gratuits, conçus avec l'IA, qui aident les étudiants à rédiger, corriger et même prédire les notes de leurs travaux. Parmi ces outils, on trouve un correcteur, un correcteur, un paraphraseur, un détecteur de citations et un détecteur de plagiat, visant à développer les compétences, et non à remplacer l'apprentissage.
Les prochaines lunettes connectées de Meta, Hypernova , coûteraient environ 800 $, soit bien moins que l'estimation de 1 300 $. Avec un écran intégré, des fonctions photo et des commandes gestuelles, elles visent à rendre les lunettes connectées accessibles au plus grand nombre.
La startup d'IA Perplexity propose désormais des transcriptions en direct des conférences téléphoniques trimestrielles sur les résultats des entreprises indiennes cotées en bourse. Le tableau de bord financier incluait déjà des données boursières américaines, des actualités boursières, des listes de surveillance, des graphiques et le suivi des cryptomonnaies. Cette nouvelle mise à jour ajoute des outils pour les investisseurs et des calendriers de conférences téléphoniques axés sur l'Inde.
Une enquête Google Cloud révèle que 87 % des développeurs de jeux utilisent désormais des agents d'IA pour accélérer leurs tâches, réduire leurs coûts et se concentrer sur leur créativité. Cependant, nombreux sont ceux qui s'inquiètent des pertes d'emplois, des problèmes de propriété et des coûts d'intégration élevés.
Sam Altman, PDG d'OpenAI, prévient que les États-Unis sous-estiment les progrès rapides de la Chine en matière d'IA, notamment dans les modèles open source comme DeepSeek. Il doute de l'efficacité des contrôles à l'exportation et affirme que les avancées chinoises ont incité OpenAI à publier ses propres modèles open source.
DoorDash adapte l'IA à toutes les équipes pour automatiser les tâches, personnaliser l'apprentissage et permettre aux non-ingénieurs de créer des outils. L'IA améliore les flux de travail RH, accélère l'analyse des retours et permet de créer des plans de développement sur mesure, sans se substituer au jugement humain.