Xiaomi представила MiMo-V2-Pro — флагманскую LLM с более чем 1 ТБ параметров

Xiaomi продолжает активно штурмовать рынок больших языковых моделей (LLM). После майского релиза MiMo-7B и декабрьского MiMo-V2-Flash, компания представила сразу три новинки: MiMo-V2-Pro, MiMo-V2-Omni и MiMo-V2-TTS.

Вся троица уже вовсю внедряется в экосистему Xiaomi: от MiMo Studio и фирменного браузера до пакета Kingsoft Office. Разработчики могут пощупать модели через инструменты OpenClaw, OpenCode и Cline, причем Xiaomi дает неделю бесплатного триал-периода для тестов.

Xiaomi MiMo-V2-Pro

Главная звезда презентации — MiMo-V2-Pro. Xiaomi позиционирует её как флагманскую модель для «эры агентов». Она заточена под серьезные рабочие нагрузки: общее количество параметров превышает 1 ТБ, а окно контекста составляет немалый 1 МБ.

Xiaomi утверждает, что MiMo-V2-Pro щелкает как орешки сложные задачи вроде оркестровки рабочих процессов и долгосрочного планирования без участия человека. По заверениям компании, производительность модели вплотную приближается к Claude Opus 4.6, но при этом работа через API стоит значительно дешевле. Ценник стартует от $1 (около 92 рублей) за миллион входных токенов для небольших контекстов и растет по мере их увеличения.

Модель уже интегрирована в инструменты WPS Office от Kingsoft, где она может помогать в работе с документами Word, таблицами Excel, презентациями PowerPoint и PDF-файлами.

Xiaomi MiMo-V2-Omni и MiMo-V2-TTS

MiMo-V2-Omni — это мультимодальный боец. Модель спроектирована для одновременной обработки аудио, изображений и видео. Xiaomi хвастается отличными результатами в распознавании звука и визуальном анализе.

Эта нейронка понимает длинные аудиозаписи, распознает голоса нескольких спикеров и умеет проводить комбинированный анализ видео вместе со звуковой дорожкой. В некоторых сценариях, по заявлению разработчиков, MiMo-V2-Omni по качеству понимания аудио обходит даже Gemini 3 Pro.

В свою очередь, MiMo-V2-TTS — это модель для синтеза речи. Здесь можно тонко настраивать тон, эмоции и даже стиль речи. Xiaomi заявляет, что модель справляется с чем угодно: от обычной беседы «за жизнь» до пения, причем с поддержкой различных китайских диалектов.

Все три модели уже доступны на API-платформе Xiaomi по довольно агрессивным ценам. Многие техногиганты сейчас собирают подобные стеки из текстовых, мультимодальных и голосовых моделей, но Xiaomi впечатляет скоростью итераций и тем, как плотно эти инструменты вшиваются в уже существующий софт компании.

Поскольку новые модели MiMo интегрированы в глобальные сервисы и API Xiaomi, они будут доступны разработчикам и пользователям умных устройств бренда во всем мире, включая Россию и страны СНГ.

Источник

Xiaomi представила MiMo-V2-Pro — флагманскую LLM с более чем 1 ТБ параметров

Samsung Galaxy Tab S12 может получить процессор MediaTek Dimensity 9500

Первые наушники-клипсы Xiaomi получат 11-мм драйверы, поддержку LHDC 5.0 и Hi-Res Audio

Xiaomi Smart Band 10 Pro получила поддержку экосистемы Apple, управление с iPhone и синхронизацию данных о здоровье

Xiaomi представила MiMo-V2-Pro — флагманскую LLM с более чем 1 ТБ параметров

Xiaomi MiMo-V2-Pro

Xiaomi MiMo-V2-Omni и MiMo-V2-TTS

Похожие новости

Samsung Galaxy Tab S12 может получить процессор MediaTek Dimensity 9500

Первые наушники-клипсы Xiaomi получат 11-мм драйверы, поддержку LHDC 5.0 и Hi-Res Audio

Xiaomi Smart Band 10 Pro получила поддержку экосистемы Apple, управление с iPhone и синхронизацию данных о здоровье