Veille IA/Tech — 26 mars 2026

🏆 ARC-AGI-3 : le benchmark de raisonnement gĂ©nĂ©ral passe en v3

Le ARC Prize publie ARC-AGI-3, nouvelle itĂ©ration du benchmark conçu pour tester la gĂ©nĂ©ralisation des IA au-delĂ  de la mĂ©morisation. AprĂšs qu’ARC-AGI-2 ait Ă©tĂ© rapidement saturĂ© par les modĂšles frontier, cette version introduit des tĂąches encore plus rĂ©sistantes aux approches de fitting. Le leaderboard et les donnĂ©es d’évaluation sont disponibles publiquement. À surveiller de prĂšs pour calibrer les progrĂšs rĂ©els vers le raisonnement gĂ©nĂ©ral.


☠ Supply chain : LiteLLM touchĂ© par l’attaque TeamPCP

Selon ReversingLabs, le groupe TeamPCP a Ă©tendu son attaque de la chaĂźne d’approvisionnement Ă  LiteLLM, la librairie Python open-source servant de proxy unifiĂ© pour 100+ APIs LLM (OpenAI, Anthropic, AWS Bedrock, VertexAI
). Un package malveillant a Ă©tĂ© distribuĂ© via PyPI. Action requise pour tout projet dĂ©pendant de LiteLLM : audit des versions, vĂ©rification des hashes, mise Ă  jour vers les releases officielles post-patch.


📊 Claude Code : 90% des outputs vers des repos à moins de 2 stars

Une analyse agrĂ©gĂ©e depuis le lancement de Claude Code montre que 90% du code gĂ©nĂ©rĂ© et poussĂ© sur GitHub aboutit dans des dĂ©pĂŽts quasi-invisibles (< 2 stars). Ce chiffre alimente le dĂ©bat sur la nature rĂ©elle de l’adoption des outils de coding IA : prototypage jetable, usage interne non public, ou simple dĂ©calage entre gĂ©nĂ©ration de code et projets Ă  valeur durable ? Un signal utile pour contextualiser les mĂ©triques d’adoption.


🚹 “Disregard That” : anatomie des attaques par injection de prompt

Cal Paterson publie une analyse technique approfondie des attaques d’injection de prompt indirectes — celles oĂč du contenu tiers (pages web scrapĂ©es, emails, documents dans un RAG) contient des instructions conçues pour subvertir le comportement du LLM. L’article dĂ©cortique pourquoi les mitigations actuelles (dĂ©limiteurs, system prompts renforcĂ©s) restent insuffisantes, et pourquoi la confusion instruction/donnĂ©es est un problĂšme architecturalement difficile Ă  rĂ©soudre dans les pipelines agentiques.


đŸ€– Optio : agents de coding orchestrĂ©s dans Kubernetes

Optio est un projet open-source qui orchestre des agents IA de coding dans des pods Kubernetes, prenant en entrĂ©e un ticket et produisant une Pull Request. Chaque agent s’exĂ©cute dans un environnement isolĂ© et reproductible, avec support du parallĂ©lisme. IntĂ©ressant pour les Ă©quipes voulant industrialiser les workflows agentiques sans dĂ©pendance Ă  des plateformes SaaS fermĂ©es (Devin, Copilot Workspace
). Stade early mais architecture claire.


📉 Fausses affirmations dans un paper