Microsoft publie le modèle de raisonnement Phi-4

Mais aussi : Amazon lance le modèle Nova Premier, Microsoft hébergera Grok AI et plus encore.

Aujourd'hui:

  • Microsoft publie le modèle de raisonnement Phi-4

  • Claude Gains Intégrations et Mode Recherche

  • Amazon lance le modèle Nova Premier

  • Microsoft hébergera Grok AI

Ne restez pas à la traîne. Maîtrisez les dernières innovations en IA et propulsez votre carrière vers de nouveaux sommets. Inscrivez-vous maintenant et devenez un leader en IA.

49,00 € 99,00 €

Microsoft a lancé Phi-4-Reasoning-Plus , un modèle d'IA ouvert, compact mais puissant, axé sur le raisonnement profond. Il utilise le réglage fin supervisé et l'apprentissage par renforcement pour surpasser des modèles beaucoup plus grands dans les tâches mathématiques, logiques et de codage. Entraîné sur des données soigneusement sélectionnées, il privilégie la transparence et la réflexion étape par étape. Avec une taille de paramètre de 14 milliards de dollars et une licence MIT, il est optimisé pour offrir performances et accessibilité dans les environnements de recherche, d'entreprise et sensibles à la sécurité.

Pourquoi c'est important

  1. Raisonnement élevé dans les petits modèles – Cela prouve que les petits modèles, lorsqu’ils sont bien entraînés, peuvent rivaliser ou battre des modèles beaucoup plus grands dans des tâches de raisonnement complexes.

  2. Déploiement ouvert et flexible – Sa licence permissive et sa compatibilité avec les principaux frameworks permettent une large utilisation dans des contextes commerciaux et de recherche.

  3. Résultats sûrs et interprétables – Conçu pour la transparence et l’alignement, il prend en charge le déploiement responsable de l’IA dans des environnements réglementés ou à enjeux élevés.

Anthropic a lancé Claude Integrations , permettant aux utilisateurs de connecter Claude à des outils comme Jira, Zapier et Intercom, lui offrant ainsi un contexte complet sur les applications professionnelles et la possibilité d'agir sur toutes les plateformes. Claude a également bénéficié d'un puissant mode Recherche , qui effectue des analyses approfondies sur le web, Google Workspace et les outils connectés, et fournit des rapports avec leurs sources en moins de 45 minutes. Ces mises à jour font de Claude un assistant plus intelligent et réactif pour les tâches complexes et les workflows d'entreprise.

Pourquoi c'est important

  1. Transforme Claude en agent IA – Grâce à l’intégration d’outils et à l’exécution de tâches, Claude passe du statut de chatbot à celui d’assistant IA compétent.

  2. Étend l'utilité du LLM dans les entreprises – Claude prend désormais en charge l'automatisation approfondie des flux de travail, la recherche et la collaboration d'équipe sur de véritables applications professionnelles.

  3. Établit une nouvelle référence en matière de connaissance du contexte de l’IA – Claude peut désormais comprendre l’historique complet des projets et les données provenant de plusieurs plates-formes, améliorant ainsi la pertinence et la fiabilité des réponses.

Amazon a lancé Nova Premier , son modèle d'IA le plus avancé à ce jour, conçu pour le raisonnement complexe, les entrées multimodales et les flux de travail à grande échelle. Avec une fenêtre contextuelle d'un million de jetons , il excelle dans des tâches telles que la recherche d'investissement utilisant des systèmes multi-agents. Nova Premier peut également servir de modèle enseignant pour créer des versions plus petites et plus rapides comme Nova Micro via la distillation de modèles , rendant les fonctionnalités d'IA avancées plus rentables et déployables dans les environnements de production utilisant Amazon Bedrock.

Pourquoi c'est important

  1. Gestion de contexte inégalée – Avec la prise en charge d' un million de jetons , Nova Premier repousse les limites de la compréhension du contexte long dans les applications d'IA d'entreprise.

  2. Distillation de modèles à grande échelle – Elle permet une IA pratique et de qualité production en transférant des capacités de premier ordre dans des modèles plus petits et optimisés pour des cas d'utilisation réels.

  3. Orchestration IA multi-agents – Nova Premier permet une collaboration sophistiquée entre agents, marquant ainsi une transition des sorties à modèle unique vers des systèmes d'IA gérant des flux de travail entiers.

🧠 RECHERCHE

Sadeed est un modèle léger pour la langue arabe qui améliore considérablement la diacritisation des textes, un défi de taille compte tenu de la complexité de la langue. Optimisé sur des données propres et de haute qualité, il rivalise avec des modèles plus volumineux tout en utilisant moins de ressources. L'article présente également un nouveau benchmark, SadeedDiac-25, permettant de mieux évaluer la diacritisation des différents types de textes.

Le raisonnement Phi-4 est un modèle à 14 paramètres B conçu pour les tâches de réflexion complexes. Affiné par des suggestions soigneusement sélectionnées et renforcé par l'apprentissage par renforcement, il génère un raisonnement clair, étape par étape. Il surpasse des modèles ouverts beaucoup plus grands et rivalise avec les systèmes de pointe en mathématiques, codage, planification et sciences, prouvant ainsi qu'un entraînement intelligent ne se limite pas à la taille du modèle.

Foundation-Sec-8B est un modèle de langage axé sur la cybersécurité, basé sur Llama 3.1 et entraîné à partir de données de sécurité spécialisées. Malgré sa taille réduite, il est comparable à des modèles beaucoup plus volumineux comme Llama 3.1-70B et GPT-4o-mini pour des tâches clés de cybersécurité. Cette version ouverte vise à promouvoir l'adoption de l'IA dans les secteurs de la sécurité publique et privée.

RoboVerse est une plateforme unifiée d'apprentissage robotique combinant des outils de simulation, un vaste ensemble de données synthétiques et des benchmarks standardisés. Elle prend en charge différents simulateurs et types de robots grâce à une interface universelle appelée MetaSim. En améliorant la qualité des données et la cohérence des évaluations, RoboVerse contribue à optimiser les performances de l'apprentissage par imitation, de l'apprentissage par renforcement et du transfert de la simulation vers le réel.

📲 RÉSEAUX SOCIAUX

🗞️PLUS D'ACTUALITÉS

  • Microsoft se prépare à héberger l'IA Grok d'Elon Musk sur Azure, étendant ainsi sa prise en charge de modèles concurrents au-delà d'OpenAI. Cette décision pourrait mettre à rude épreuve son partenariat avec OpenAI et témoigne de la volonté de Microsoft de dominer l'infrastructure de l'IA.

  • Ai2 a publié Olmo 2 1B, un petit modèle d'IA open source qui surpasse les modèles de taille similaire de Google, Meta et Alibaba aux tests de raisonnement et de véracité. Il fonctionne sur du matériel de base et est entièrement reproductible.

  • Midjourney a mis à jour son modèle d'image v7 avec une meilleure qualité d'image, un rendu amélioré des mains et du corps, et un alignement plus intelligent des invites. De nouveaux outils d'édition, une interface repensée et un paramètre --exp pour un meilleur contrôle des détails visuels ont également été ajoutés.

  • L'application Gemini de Google intègre désormais des outils de retouche d'images, permettant aux utilisateurs de modifier ou de générer des images en modifiant les arrière-plans, les objets ou l'apparence. Cette fonctionnalité est progressivement déployée dans plus de 45 langues et dans la plupart des pays.

  • Les lunettes connectées Ray-Ban de Meta enregistrent désormais la voix par défaut pour entraîner leur IA. Les utilisateurs ne peuvent pas désactiver complètement l'enregistrement, mais seulement supprimer des enregistrements individuels ou désactiver la commande vocale. Les images des caméras ne sont utilisées par l'IA que si elles sont partagées. Les préoccupations en matière de confidentialité augmentent.

  • Amazon Web Services développe un nouvel outil de codage basé sur l'IA pour concurrencer des startups comme Cursor et Windsurf. Il combinera édition, test et débogage dans une seule application, visant à optimiser la productivité des développeurs et à accroître l'utilisation du cloud AWS  .

  • Une nouvelle étude affirme que le benchmark d'IA LMArena avantage injustement les grands acteurs comme OpenAI et Meta en leur permettant de tester et de soumettre uniquement les versions de modèles les plus performantes. Les chercheurs ont également signalé des inégalités d'accès aux données et des suppressions de modèles cachées. LMArena nie toute partialité, mais pourrait revoir ses politiques de soumission et de transparence.

  • L'application NotebookLM de Google est désormais disponible en pré-inscription sur l'App Store et Google Play, avec une date de sortie prévue vers le 20 mai.

🎬DERNIÈRES VIDÉOS