l'AGI ARRIVE, Préparez-vous
Posts
Qwen3-Coder-Next : une puissance de feu pour coder en local

Qwen3-Coder-Next : une puissance de feu pour coder en local

AUSSI : ElevenLabs lance des "Skills" prêts à l'emploi pour les agents IA, Sam Altman prédit des "idées inédites" pour 2026, et plus encore.

VISION IA
4 févr.

In partnership with

Aujourd'hui:

Qwen3-Coder-Next : une puissance de feu pour coder en local
WorldVQA : le fossé entre voir et savoir
Claude dans Xcode : le premier agent qui peut "voir" vos bugs
ElevenLabs Skills : de l'audio prêt à brancher pour les agents IA
Sam Altman : 2026 apportera des "idées inédites"

Privacy-first email. Built for real protection.

Proton Mail offers what others won’t:

End-to-end encryption by default
Zero access to your data
Open-source and independently audited
Based in Switzerland with strong privacy laws
Free to start, no ads

We don’t scan your emails. We don’t sell your data. And we don’t make you dig through settings to find basic security. Proton is built for people who want control, not compromise.

Simple, secure, and free.

Explore Proton’s benefits

Le nouveau modèle de coding "petit mais agentique" de Qwen vise directement les workflows de développement local

Passons à Qwen3-Coder-Next, positionné comme un modèle open-weight spécialement conçu pour les agents de coding et le développement local, construit sur une architecture hybride attention + MoE épars.

Les chiffres annoncés sont impressionnants :

80 milliards de paramètres au total mais seulement ~3 milliards activés (efficacité style MoE), visant des performances de "gros modèle" avec un coût d'inférence réduit.

Entraînement agentique à grande échelle (interaction avec l'environnement + synthèse de tâches exécutables + RL) pour le rendre meilleur en utilisation d'outils multi-étapes et en récupération quand les choses plantent en cours de route.

Contexte natif de 256K tokens, et ils disent pouvoir l'étendre jusqu'à 1 million de tokens avec Yarn, optimisé pour la compréhension à l'échelle d'un repo entier.

Il est explicitement présenté comme s'intégrant aux scaffolds d'agents sur différents outils/plateformes (l'idée c'est : "branchez-le dans votre workflow, pas besoin de le materner").

Pourquoi c'est important : si le mouvement d'Apple c'est "les agents dans l'IDE", celui de Qwen c'est "des agents que vous pouvez faire tourner/héberger plus librement". Combinez les deux et vous obtenez une direction claire pour 2026 : le coding agentique partout, avec plus de choix sur où tourne le cerveau.

Apple vient de transformer Xcode en "espace de travail pour agents" (le SDK Claude Agent est maintenant natif)

La grande nouvelle : Xcode 26.3 ajoute le support natif du SDK Claude Agent d'Anthropic – le même outil qui fait tourner Claude Code. Autrement dit, ce n'est plus juste de l'autocomplétion ou une petite bulle d'aide. C'est plutôt : donnez un objectif à l'IDE, laissez-le planifier, exécuter, itérer, et il ne vous sollicite que quand il a besoin d'une vraie décision.

Ce qui m'a marqué :

Des tâches autonomes de longue durée dans Xcode (pas juste du prompt tour par tour).

Vérification visuelle via les Previews : l'agent peut regarder les previews SwiftUI, repérer les problèmes et corriger – sans que vous fassiez le messager entre "ce qu'il a construit" et "ce que ça devrait être".

Raisonnement à l'échelle du projet : il peut scanner la structure des fichiers et l'architecture d'abord, puis décider quoi modifier (au lieu d'éditer aveuglément le fichier ouvert).

Support MCP (Model Context Protocol) : les capacités de Xcode sont exposées d'une manière qui permet aux outils de se connecter plus proprement, y compris les workflows de capture de previews.

Note sur la disponibilité : Apple indique que Xcode 26.3 est en release candidate pour les membres du Apple Developer Program dès maintenant, avec une sortie App Store prochainement.

Pourquoi c'est important : les IDE grand public commencent à traiter les "agents" comme des citoyens de première classe. Une fois que ça devient la norme, le workflow par défaut devient : vous supervisez, l'agent exécute.

WorldVQA est un nouveau benchmark "vérification de réalité" pour les modèles multimodaux (reconnaissent-ils vraiment les choses, ou devinent-ils au feeling ?)

Dernier point : WorldVQA est un benchmark conçu pour tester la connaissance visuelle atomique du monde – en gros : est-ce qu'un modèle multimodal peut correctement nommer/identifier ce qu'il voit, surtout pour les entités rares, sans halluciner ?

Détails clés :

3 500 paires image-question, couvrant 9 catégories, avec une séparation explicite tête vs queue (commun vs obscur).

Le benchmark essaie d'éviter le "raisonnement de rattrapage" et se concentre sur ce que le modèle sait réellement visuellement – en découplant connaissance et raisonnement.

Ils affirment que même les modèles performants galèrent sur les connaissances de longue traîne – tombant souvent sous 50% de précision – et ils examinent aussi la calibration (confiance vs exactitude).

Pourquoi c'est important : si on construit des agents qui agissent dans le monde (ou même qui interprètent des captures d'écran/interfaces), le "feeling à peu près bon" ne suffit pas. Des benchmarks comme celui-ci forcent l'industrie à mesurer la fiabilité plutôt que les démos.

🧠 RECHERCHE

Green-VLA : un modèle Vision-Language-Action par étapes pour robots généralistes

Green-VLA est un nouveau système IA conçu pour contrôler de nombreux types de robots, des humanoïdes aux bras mécaniques. En s'entraînant sur 3 000 heures de données via un processus d'apprentissage en cinq étapes, il améliore significativement la façon dont les robots gèrent les tâches du monde réel comme nettoyer une table. Il corrige des problèmes courants comme les robots qui se bloquent ou qui s'agitent inutilement.

Kimi K2.5 : Intelligence Agentique Visuelle

Kimi K2.5 est un modèle IA open-source qui combine texte et vision pour résoudre des problèmes complexes. Il intègre "Agent Swarm", un outil qui découpe les grosses tâches en petits morceaux et les résout tous en même temps. Cette approche parallèle rend l'IA bien plus rapide et intelligente en coding et raisonnement visuel.

SWE-Universe : des environnements vérifiables à l'échelle de millions

SWE-Universe est un énorme nouveau jeu de données pour entraîner des programmeurs IA. Il contient plus de 2,5 millions d'environnements logiciels vérifiés, bien plus que les collections précédentes. En automatisant le processus de collecte de données, ce projet permet aux modèles IA d'apprendre à partir de millions d'exemples de code réels, améliorant leur capacité à corriger des bugs et construire des logiciels.

📲 RÉSEAUX SOCIAUX

— (@)

🗞️PLUS D'ACTUALITÉS

ElevenLabs Skills ElevenLabs a publié une collection de "skills" pour les assistants de coding IA. Ces outils prêts à l'emploi permettent aux développeurs d'ajouter facilement des fonctionnalités comme la génération vocale, les effets sonores et la musique à leurs apps sans tout construire de zéro.

Sam Altman sur le futur Le CEO d'OpenAI prédit que d'ici 2026, l'IA générera des idées complètement nouvelles, une capacité qu'il appelle "novel insights" (idées inédites). Il envisage un futur où l'IA agit comme partenaire créatif plutôt que simple processeur de données.

Intel défie Nvidia Intel revient sur le marché des puces graphiques haute performance pour défier la domination de Nvidia. Le CEO de l'entreprise a annoncé l'embauche d'un nouvel ingénieur en chef pour construire ces processeurs spécialisés, cruciaux pour faire tourner l'IA.

Infinitus AI pour la santé Infinitus a lancé un système IA pour gérer le service client des mutuelles santé. Cet outil automatise les appels téléphoniques et les tâches, visant à économiser de l'argent et aider les membres à mieux naviguer leur couverture santé.

La nouvelle aventure des fondateurs de Fitbit Les créateurs de Fitbit ont présenté Luffu, un nouveau service qui aide les familles à surveiller la santé de chacun. La plateforme utilise l'IA pour organiser les données médicales et détecter les signes d'alerte dans les routines quotidiennes, simplifiant les tâches de suivi.

Siemens Energy et l'IA Les dirigeants du secteur énergétique affirment que l'intelligence artificielle est essentielle pour moderniser les réseaux électriques, selon un rapport Siemens. Bien que l'IA consomme de l'énergie, sa capacité à optimiser des réseaux électriques complexes est vue comme critique pour la transition vers l'énergie verte.

Chute du secteur logiciel pour les investisseurs Les fonds d'investissement privés perdent de la valeur car les éditeurs de logiciels qu'ils détiennent sont en difficulté. Les investisseurs craignent que les dépenses massives en intelligence artificielle ne génèrent pas de profits assez vite pour ces entreprises tech.

Panne de Claude Code L'outil de coding d'Anthropic, Claude Code, a planté mondialement pendant 20 minutes, bloquant les développeurs hors de leur travail. Cette brève panne a mis en lumière les risques de dépendre de systèmes IA cloud qui nécessitent une connexion internet permanente.

Perquisitions dans les bureaux de X La police française a perquisitionné les bureaux de X (ex-Twitter), tandis que le Royaume-Uni a lancé une enquête sur son chatbot IA, Grok. Ces actions signalent une pression juridique croissante sur l'entreprise concernant sa gestion des données et de la technologie.