От дата-центра до кармана: Google представила LLM Gemma 4 для серверов и Gemini Nano 4 для смартфонов

Google випускає сімейство відкритих LLM Gemma 4 для дата-центрів та Gemini Nano 4 для смартфонів

Когда в конце прошлого года Google выпустила Gemini 3 Pro, это стало значительным шагом для крупных LLM компании. Теперь компания переносит часть тех же технологий, которые сделали эти модели возможными, в открытую среду с новым семейством открытых моделей — Gemma 4.

Google предлагает четыре различные версии Gemma 4, отличающиеся количеством параметров. Для периферийных устройств, в частности смартфонов, компания подготовила 2-миллиардную и 4-миллиардную «Effective»-модели. Для более мощных машин — 26-миллиардную систему «Mixture of Experts» и 31-миллиардную «Dense».

Для тех, кто не знаком с темой: параметры — это настройки, которые большая языковая модель может изменять для генерации ответа. Как правило, модели с большим количеством параметров дают лучшие результаты, однако для их запуска требуется и более мощное железо.

«С Gemma 4 нам удалось разработать системы с беспрецедентным уровнем интеллекта на параметр», — утверждает Google.

В подтверждение этого компания ссылается на результаты 31-миллиардного и 26-миллиардного вариантов Gemma 4, которые заняли третье и шестое места соответственно в текстовом рейтинге Arena AI, опередив модели, которые в 20 раз больше по размеру. Все модели могут обрабатывать видео и изображения, что делает их идеальными для задач вроде оптического распознавания символов. Две меньшие модели также способны обрабатывать аудиовходы и понимать речь.

Отдельно Google отмечает, что семейство Gemma 4 способно генерировать код в офлайн-режиме — то есть вайб-кодингом можно заниматься без подключения к интернету. Кроме того, Google обучила модели более чем 140 языкам.

Google выпускает семейство Gemma 4 под лицензией Apache 2.0. Предыдущие модели Gemma компания предоставляла через собственную лицензию Gemma. Этот шаг даст людям значительно больше свободы в адаптации новых систем под свои потребности.

«Эта лицензия с открытым кодом обеспечивает основу для полной гибкости разработчиков и цифрового суверенитета; предоставляя вам полный контроль над вашими данными, инфраструктурой и моделями. Она позволяет свободно строить и безопасно развертывать продукты в любой среде — как в собственной инфраструктуре, так и в облаке», — заявила Google.

Если вы хотите попробовать одну из систем самостоятельно, веса моделей доступны через Hugging Face, Kaggle и Ollama. Два больших варианта Gemma 4 — 26B Mixture of Experts и 31B Dense — рассчитаны на запуск без квантизации в формате bfloat16 на одном GPU NVIDIA H100 с 80 ГБ видеопамяти. При квантизации до более низкой точности эти модели поместятся на потребительских видеокартах.

Google также сосредоточилась на снижении задержки: модель 26B MoE активирует только 3,8 млрд из 26 млрд параметров в режиме inference, что обеспечивает значительно более высокую скорость генерации токенов по сравнению с моделями аналогичного размера. Модель 31B Dense ориентирована скорее на качество, чем на скорость, — Google ожидает, что разработчики будут дообучать ее под конкретные задачи.

СпецпроектыSense Bank розширює можливості для юридичних осіб. Які нові функції запрацювали у застосунку банкаТОП 3 відеореєстратори DDPAI на будь-який гаманець

Модели Effective 2B и Effective 4B для мобильных устройств разрабатывались командой Pixel в тесном сотрудничестве с Qualcomm и MediaTek. Они оптимизированы не только для смартфонов, но и для таких устройств, как Raspberry Pi и Jetson Nano. По сравнению с Gemma 3 они потребляют меньше памяти и энергии, а Google заявляет о «почти нулевой задержке».

Помимо мультимодальности и генерации кода, Gemma 4 готова к агентским сценариям использования: модели поддерживают нативный вызов функций (function calling), структурированный вывод в формате JSON, а также встроенные инструкции для работы с популярными инструментами и API. Контекстное окно для моделей E2B и E4B теперь составляет 128 тысяч токенов, а для 26B и 31B — 256 тысяч. Для облачных моделей Gemini этот показатель остается значительно больше — 1 миллион токенов.

Изменение лицензии с собственной Gemma на Apache 2.0 может оказаться даже важнее технических улучшений. Лицензия Gemma 3 содержала строгие ограничения на использование, которые Google могла обновлять в одностороннем порядке; она обязывала разработчиков следовать правилам Google во всех проектах на основе Gemma и потенциально распространялась даже на модели, обученные на синтетических данных, сгенерированных Gemma.

Apache 2.0 не имеет подобных обременительных условий и коммерческих ограничений. Google также впервые подтвердила существование Gemini Nano 4 — следующего поколения минимальной модели искусственного интеллекта для смартфонов. Нынешний Gemini Nano 3 в телефонах Pixel базируется на Gemma 3n; Nano 4 будет иметь варианты на 2B и 4B параметров на основе Gemma 4 E2B и E4B соответственно.

Разработчики уже могут прототипировать агентные сценарии с Gemma E2B и E4B в рамках AI Core Developer Preview — проекты, созданные на этих моделях, будут совместимы с Gemini Nano 4 после его выхода. Подробнее об этом Google может рассказать на конференции I/O, которая состоится через несколько недель.

Gemini Nano 4 будет существовать в двух версиях. Nano 4 Fast базируется на Gemma 4 E2B и оптимизирован для максимальной скорости и минимальной задержки — он работает втрое быстрее версии на базе E4B. Nano 4 Full базируется на Gemma 4 E4B и рассчитан на более сложные задачи, где важнее качество ответа, а не скорость.

По сравнению с предыдущими версиями Gemini Nano 4 работает до четырех раз быстрее и потребляет до 60% меньше заряда батареи. Google ранее обозначала модели как «nano-v2» и «nano-v3» — последняя уже доступна на Pixel 10 и Galaxy S26. Среди конкретных улучшений Nano 4 Google назвала выделяет несколько ключевых сценариев. В области рассуждений модель теперь лучше обрабатывает цепные команды и условные конструкции — например, может автоматически проверять комментарии на соответствие правилам сообщества и возвращать структурированный результат с указанием причины нарушения.

Математические способности также улучшились: модель точнее отвечает на практические расчетные запросы. Отдельно усовершенствовано понимание времени — Nano 4 точнее работает со сценариями, включающими календари, напоминания и будильники. Официальный запуск Gemini Nano 4 состоится на новых флагманских Android-устройствах позже в этом году.

Важно, что код, написанный сегодня для Gemma 4, будет автоматически работать на устройствах с Gemini Nano 4 без каких-либо изменений. В течение периода предыдущего пересмотра Google планирует добавить поддержку вызова инструментов, структурированного вывода, системных промптов и режима «thinking» в Prompt API.

Google представила Gemma 3 — найпотужнішу в світі модель ШІ для запуску на одній відеокарті

Источник: Engadget

От дата-центра до кармана: Google представила LLM Gemma 4 для серверов и Gemini Nano 4 для смартфонов

Популярное

MILA NITICH презентовала исповедь «Каюсь» на украинском языке