🤖 Veille IA & Tech — 18 mars 2026

Veille IA — Mercredi 18 mars 2026

🦑 Xiaomi MiMo V2 Pro : les modèles furtifs d’OpenRouter démasqués

Les modèles Hunter Alpha et Healer Alpha testés discrètement sur OpenRouter sont officiellement confirmés comme étant MiMo V2 Pro de Xiaomi.

Hunter Alpha = MiMo V2 Pro Text-only Reasoning, contexte 1M tokens (1 048 576), max output 32k
Healer Alpha = MiMo V2 Omni (texte + image), contexte 262K, max output 32k
Des benchmarks ont fuité sur Artificial Analysis
Un nouveau modèle Xiaomi serait annoncé prochainement

🔧 Mistral AI lance Forge

Mistral publie Forge, une nouvelle plateforme annoncée sobrement sur leur blog. La sortie coïncide avec la fenêtre GTC 2026 (16-19 mars). Les détails techniques restent limités — à surveiller pour les cas d’usage fine-tuning et déploiement enterprise.

🛡️ Sécurité RAG : 95% de succès pour les attaques par poisoning

Un lab open-source teste la robustesse des stacks RAG locaux face aux attaques par empoisonnement de base de connaissance.

Stack testée : ChromaDB + LM Studio (Qwen2.5-7B) + LangChain, sans API cloud, sur MacBook Pro.

Résultats :

Taux de succès de l’attaque sur config non défendue : 95%
L’attaque opère au niveau retrieval, sans jailbreak ni accès direct au modèle
Le projet inclut des défenses testées et mesurées

Un rappel important que la sécurité RAG en production locale est souvent sous-estimée.

🌊 Mamba 3 : nouveau State Space Model orienté inférence

Mamba 3 fait son apparition dans la communauté. Ce State Space Model de troisième génération est conçu pour maximiser l’efficacité à l’inférence, en réponse aux limites de complexité quadratique de l’attention des transformers classiques. Les détails architecturaux complets ne sont pas encore disponibles, mais l’axe SSM reste une direction de recherche active pour les modèles locaux efficaces.

🤗 HuggingFace : hf-agents, un one-liner pour déployer un agent local

HuggingFace publie hf-agents : une commande unique qui :

Détecte automatiquement le hardware disponible
Sélectionne le meilleur modèle et quant via llmfit
Lance un serveur llama.cpp
Déploie Pi, l’agent derrière OpenClaw 🦞

Controverse : la communauté critique rapidement l’outil pour ses recommandations de modèles considérés obsolètes (StarCoder, Llama 3.1, Gemma 2