Xiaomi продолжает активно штурмовать рынок больших языковых моделей (LLM). После майского релиза MiMo-7B и декабрьского MiMo-V2-Flash, компания представила сразу три новинки: MiMo-V2-Pro, MiMo-V2-Omni и MiMo-V2-TTS.
Вся троица уже вовсю внедряется в экосистему Xiaomi: от MiMo Studio и фирменного браузера до пакета Kingsoft Office. Разработчики могут пощупать модели через инструменты OpenClaw, OpenCode и Cline, причем Xiaomi дает неделю бесплатного триал-периода для тестов.
Xiaomi MiMo-V2-Pro
Главная звезда презентации — MiMo-V2-Pro. Xiaomi позиционирует её как флагманскую модель для «эры агентов». Она заточена под серьезные рабочие нагрузки: общее количество параметров превышает 1 ТБ, а окно контекста составляет немалый 1 МБ.
Xiaomi утверждает, что MiMo-V2-Pro щелкает как орешки сложные задачи вроде оркестровки рабочих процессов и долгосрочного планирования без участия человека. По заверениям компании, производительность модели вплотную приближается к Claude Opus 4.6, но при этом работа через API стоит значительно дешевле. Ценник стартует от $1 (около 92 рублей) за миллион входных токенов для небольших контекстов и растет по мере их увеличения.
Модель уже интегрирована в инструменты WPS Office от Kingsoft, где она может помогать в работе с документами Word, таблицами Excel, презентациями PowerPoint и PDF-файлами.
Xiaomi MiMo-V2-Omni и MiMo-V2-TTS
MiMo-V2-Omni — это мультимодальный боец. Модель спроектирована для одновременной обработки аудио, изображений и видео. Xiaomi хвастается отличными результатами в распознавании звука и визуальном анализе.
Эта нейронка понимает длинные аудиозаписи, распознает голоса нескольких спикеров и умеет проводить комбинированный анализ видео вместе со звуковой дорожкой. В некоторых сценариях, по заявлению разработчиков, MiMo-V2-Omni по качеству понимания аудио обходит даже Gemini 3 Pro.
В свою очередь, MiMo-V2-TTS — это модель для синтеза речи. Здесь можно тонко настраивать тон, эмоции и даже стиль речи. Xiaomi заявляет, что модель справляется с чем угодно: от обычной беседы «за жизнь» до пения, причем с поддержкой различных китайских диалектов.
Все три модели уже доступны на API-платформе Xiaomi по довольно агрессивным ценам. Многие техногиганты сейчас собирают подобные стеки из текстовых, мультимодальных и голосовых моделей, но Xiaomi впечатляет скоростью итераций и тем, как плотно эти инструменты вшиваются в уже существующий софт компании.
Поскольку новые модели MiMo интегрированы в глобальные сервисы и API Xiaomi, они будут доступны разработчикам и пользователям умных устройств бренда во всем мире, включая Россию и страны СНГ.
