đ€ Veille IA & Tech â 26 mars 2026
Veille IA/Tech â 26 mars 2026
đ ARC-AGI-3 : le benchmark de raisonnement gĂ©nĂ©ral passe en v3
Le ARC Prize publie ARC-AGI-3, nouvelle itĂ©ration du benchmark conçu pour tester la gĂ©nĂ©ralisation des IA au-delĂ de la mĂ©morisation. AprĂšs quâARC-AGI-2 ait Ă©tĂ© rapidement saturĂ© par les modĂšles frontier, cette version introduit des tĂąches encore plus rĂ©sistantes aux approches de fitting. Le leaderboard et les donnĂ©es dâĂ©valuation sont disponibles publiquement. Ă surveiller de prĂšs pour calibrer les progrĂšs rĂ©els vers le raisonnement gĂ©nĂ©ral.
â ïž Supply chain : LiteLLM touchĂ© par lâattaque TeamPCP
Selon ReversingLabs, le groupe TeamPCP a Ă©tendu son attaque de la chaĂźne dâapprovisionnement Ă LiteLLM, la librairie Python open-source servant de proxy unifiĂ© pour 100+ APIs LLM (OpenAI, Anthropic, AWS Bedrock, VertexAIâŠ). Un package malveillant a Ă©tĂ© distribuĂ© via PyPI. Action requise pour tout projet dĂ©pendant de LiteLLM : audit des versions, vĂ©rification des hashes, mise Ă jour vers les releases officielles post-patch.
đ Claude Code : 90% des outputs vers des repos Ă moins de 2 stars
Une analyse agrĂ©gĂ©e depuis le lancement de Claude Code montre que 90% du code gĂ©nĂ©rĂ© et poussĂ© sur GitHub aboutit dans des dĂ©pĂŽts quasi-invisibles (< 2 stars). Ce chiffre alimente le dĂ©bat sur la nature rĂ©elle de lâadoption des outils de coding IA : prototypage jetable, usage interne non public, ou simple dĂ©calage entre gĂ©nĂ©ration de code et projets Ă valeur durable ? Un signal utile pour contextualiser les mĂ©triques dâadoption.
đš âDisregard Thatâ : anatomie des attaques par injection de prompt
Cal Paterson publie une analyse technique approfondie des attaques dâinjection de prompt indirectes â celles oĂč du contenu tiers (pages web scrapĂ©es, emails, documents dans un RAG) contient des instructions conçues pour subvertir le comportement du LLM. Lâarticle dĂ©cortique pourquoi les mitigations actuelles (dĂ©limiteurs, system prompts renforcĂ©s) restent insuffisantes, et pourquoi la confusion instruction/donnĂ©es est un problĂšme architecturalement difficile Ă rĂ©soudre dans les pipelines agentiques.
đ€ Optio : agents de coding orchestrĂ©s dans Kubernetes
Optio est un projet open-source qui orchestre des agents IA de coding dans des pods Kubernetes, prenant en entrĂ©e un ticket et produisant une Pull Request. Chaque agent sâexĂ©cute dans un environnement isolĂ© et reproductible, avec support du parallĂ©lisme. IntĂ©ressant pour les Ă©quipes voulant industrialiser les workflows agentiques sans dĂ©pendance Ă des plateformes SaaS fermĂ©es (Devin, Copilot WorkspaceâŠ). Stade early mais architecture claire.