🤖 Veille IA & Tech — 11 mars 2026

Veille IA/Tech — 11 mars 2026

💰 AMI (Yann LeCun) lève 1,03 milliard $ pour les World Models

La startup AMI fondée par Yann LeCun boucle un méga-tour co-mené par Cathay Innovation, Greycroft, Hiro Capital, HV Capital et Bezos Expeditions. Le pari d’AMI : les world models comme alternative architecturale aux LLMs, que LeCun considère structurellement incapables d’atteindre l’autonomie et le raisonnement humain. Meta n’est pas au cap table mais des discussions de collaboration sont actives — les world models d’AMI pourraient alimenter les futurs appareils Meta. Applications prioritaires : robotique et consumer devices.

Sources : Reuters · Heise · TheNews

🪖 Google déploie des agents IA pour le Pentagone

Google s’apprête à fournir des agents IA au Département de la Défense américain pour des travaux non-classifiés. Étape symboliquement importante après les années de tension interne autour de Project Maven (2018). La normalisation des contrats IA/défense chez les hyperscalers s’accélère, avec Microsoft (Azure/OpenAI) et Google désormais pleinement positionnés sur ce segment.

⚡ Infinity.inc dépasse vLLM sur l’inférence Qwen3

Infinity.inc publie une étude de cas montrant comment un stack d’inférence généré automatiquement surpasse vLLM sur Qwen3. L’approche exploite une génération et optimisation de kernels bas-niveau automatisée, réduisant significativement la latence et améliorant le throughput. Un signal fort que la guerre de l’efficacité d’inférence open-source entre dans une phase d’automatisation (cf. AutoKernel ci-dessous).

🔧 AutoKernel : auto-recherche de kernels GPU pour LLMs

AutoKernel est un projet open-source de RightNow-AI qui automatise la découverte et l’optimisation de kernels GPU dédiés aux LLMs. Dans la continuité des travaux sur Triton et CUTLASS, l’outil vise à supprimer le besoin d’ingénierie kernel manuelle pour optimiser l’inférence. À surveiller pour les équipes qui déploient des modèles sur hardware custom.

🎙️ TADA : speech generation open-source par Hume AI

Hume AI open-source TADA (Text-Acoustic Direct Alignment), un système de génération vocale rapide reposant sur une synchronisation fine entre représentations textuelles et acoustiques. Objectifs : réduire la latence de génération tout en améliorant la naturalité pros