🤖 Veille IA & Tech — 18 mars 2026
Veille IA — Mercredi 18 mars 2026
🦑 Xiaomi MiMo V2 Pro : les modèles furtifs d’OpenRouter démasqués
Les modèles Hunter Alpha et Healer Alpha testés discrètement sur OpenRouter sont officiellement confirmés comme étant MiMo V2 Pro de Xiaomi.
- Hunter Alpha = MiMo V2 Pro Text-only Reasoning, contexte 1M tokens (1 048 576), max output 32k
- Healer Alpha = MiMo V2 Omni (texte + image), contexte 262K, max output 32k
- Des benchmarks ont fuité sur Artificial Analysis
- Un nouveau modèle Xiaomi serait annoncé prochainement
đź”§ Mistral AI lance Forge
Mistral publie Forge, une nouvelle plateforme annoncée sobrement sur leur blog. La sortie coïncide avec la fenêtre GTC 2026 (16-19 mars). Les détails techniques restent limités — à surveiller pour les cas d’usage fine-tuning et déploiement enterprise.
🛡️ Sécurité RAG : 95% de succès pour les attaques par poisoning
Un lab open-source teste la robustesse des stacks RAG locaux face aux attaques par empoisonnement de base de connaissance.
Stack testée : ChromaDB + LM Studio (Qwen2.5-7B) + LangChain, sans API cloud, sur MacBook Pro.
Résultats :
- Taux de succès de l’attaque sur config non défendue : 95%
- L’attaque opère au niveau retrieval, sans jailbreak ni accès direct au modèle
- Le projet inclut des défenses testées et mesurées
Un rappel important que la sécurité RAG en production locale est souvent sous-estimée.
🌊 Mamba 3 : nouveau State Space Model orienté inférence
Mamba 3 fait son apparition dans la communauté. Ce State Space Model de troisième génération est conçu pour maximiser l’efficacité à l’inférence, en réponse aux limites de complexité quadratique de l’attention des transformers classiques. Les détails architecturaux complets ne sont pas encore disponibles, mais l’axe SSM reste une direction de recherche active pour les modèles locaux efficaces.
🤗 HuggingFace : hf-agents, un one-liner pour déployer un agent local
HuggingFace publie hf-agents : une commande unique qui :
- Détecte automatiquement le hardware disponible
- Sélectionne le meilleur modèle et quant via llmfit
- Lance un serveur llama.cpp
- Déploie Pi, l’agent derrière OpenClaw 🦞
Controverse : la communauté critique rapidement l’outil pour ses recommandations de modèles considérés obsolètes (StarCoder, Llama 3.1, Gemma 2