🤖 Veille IA & Tech — 27 mars 2026

🤖 Veille IA/Tech — Vendredi 27 mars 2026

🔊 Mistral lance Voxtral TTS : open-weights, 3B paramètres

Mistral publie Voxtral TTS, un modèle text-to-speech à poids ouverts de 3 milliards de paramètres (~3 Go RAM). Caractéristiques clés :

Latence : 90ms time-to-first-audio
9 langues supportées
Mistral revendique une supériorité sur ElevenLabs Flash v2.5 en tests de préférence humaine
Une variante Voxtral-4B-TTS-2603 est déjà disponible sur HuggingFace

À noter : la page officielle Mistral renvoie une 404 au moment de la publication, mais le modèle est actif.

🔍 Chroma Context-1 : agent de recherche 20B auto-éditant

ChromaDB publie Context-1, un modèle agentic de 20 milliards de paramètres entraîné pour la recherche itérative auto-correctrice. L’agent apprend à reformuler ses propres requêtes sans intervention humaine (self-editing search). Les poids sont disponibles via HuggingFace chromadb/context-1.

Approche intéressante pour les pipelines RAG avancés où la qualité de la requête conditionne le résultat final.

🎤 Cohere Transcribe : modèle ASR 2B, Apache 2.0, 14 langues

Cohere lance Cohere Transcribe, son premier modèle de transcription automatique de la parole :

2B paramètres, licence Apache 2.0
14 langues : EN, FR, DE, IT, ES, PT, EL, NL, PL, ZH, JA, KO, VI, AR
Se revendique SOTA parmi les modèles open-source de transcription

À mettre en perspective avec le benchmark médical communautaire de 31 modèles STT, où Microsoft VibeVoice-ASR 9B décroche la meilleure performance open-source (8.34% WER), proche de Gemini 2.5 Pro (8.15%), mais avec un coût compute élevé (9B params, ~18GB VRAM, 97s/fichier sur H100).

⚡ Qwen3.5-27B : 1,1 million de tokens/s sur 96× NVIDIA B200

Un benchmark vLLM communautaire documente 1 103 941 tok/s sur Qwen3.5-27B dense (