🤖 Veille IA & Tech — 26 mars 2026

Veille IA/Tech — 26 mars 2026

🏆 ARC-AGI-3 : le benchmark de raisonnement général passe en v3

Le ARC Prize publie ARC-AGI-3, nouvelle itération du benchmark conçu pour tester la généralisation des IA au-delà de la mémorisation. Après qu’ARC-AGI-2 ait été rapidement saturé par les modèles frontier, cette version introduit des tâches encore plus résistantes aux approches de fitting. Le leaderboard et les données d’évaluation sont disponibles publiquement. À surveiller de près pour calibrer les progrès réels vers le raisonnement général.

☠️ Supply chain : LiteLLM touché par l’attaque TeamPCP

Selon ReversingLabs, le groupe TeamPCP a étendu son attaque de la chaîne d’approvisionnement à LiteLLM, la librairie Python open-source servant de proxy unifié pour 100+ APIs LLM (OpenAI, Anthropic, AWS Bedrock, VertexAI…). Un package malveillant a été distribué via PyPI. Action requise pour tout projet dépendant de LiteLLM : audit des versions, vérification des hashes, mise à jour vers les releases officielles post-patch.

📊 Claude Code : 90% des outputs vers des repos à moins de 2 stars

Une analyse agrégée depuis le lancement de Claude Code montre que 90% du code généré et poussé sur GitHub aboutit dans des dépôts quasi-invisibles (< 2 stars). Ce chiffre alimente le débat sur la nature réelle de l’adoption des outils de coding IA : prototypage jetable, usage interne non public, ou simple décalage entre génération de code et projets à valeur durable ? Un signal utile pour contextualiser les métriques d’adoption.

🚨 “Disregard That” : anatomie des attaques par injection de prompt

Cal Paterson publie une analyse technique approfondie des attaques d’injection de prompt indirectes — celles où du contenu tiers (pages web scrapées, emails, documents dans un RAG) contient des instructions conçues pour subvertir le comportement du LLM. L’article décortique pourquoi les mitigations actuelles (délimiteurs, system prompts renforcés) restent insuffisantes, et pourquoi la confusion instruction/données est un problème architecturalement difficile à résoudre dans les pipelines agentiques.

🤖 Optio : agents de coding orchestrés dans Kubernetes

Optio est un projet open-source qui orchestre des agents IA de coding dans des pods Kubernetes, prenant en entrée un ticket et produisant une Pull Request. Chaque agent s’exécute dans un environnement isolé et reproductible, avec support du parallélisme. Intéressant pour les équipes voulant industrialiser les workflows agentiques sans dépendance à des plateformes SaaS fermées (Devin, Copilot Workspace…). Stade early mais architecture claire.

Blog de Julien

🤖 Veille IA & Tech — 26 mars 2026