Google Gemma 3n в финальной версии с улучшениями

Google объявила о доступности финальной версии Gemma 3n . Модель с открытым исходным кодом, выпущенная в предварительном просмотре в конце мая , может работать локально на устройствах благодаря своему небольшому размеру. Таким образом, она является прямым конкурентом моделей Phi-4 от Microsoft.
Расширенные возможности Google Gemma 3nGemma 3n можно назвать версией Gemini Nano с открытым исходным кодом, поскольку она имеет ту же базовую архитектуру. Модель получена из Gemma 3, но имеет меньшие размеры, поэтому она может работать непосредственно на смартфонах, планшетах и ноутбуках.
Gemma 3n предлагается в двух версиях: E2B и E4B (E означает Effective). Фактическое количество параметров составляет 5 и 8 миллиардов соответственно. Однако Google DeepMind разработала технологию Per-Layer Embeddings (PLE), которая радикально снижает использование оперативной памяти, поэтому модели сопоставимы с моделями с 2 и 4 миллиардами параметров, отсюда и названия E2B и E4B.
Gemma 3n является мультимодальным. Помимо текста, он может понимать и обрабатывать изображения, аудио и видео . Благодаря усовершенствованиям, реализованным компанией Mountain View, он поддерживает 140 языков для текста и 35 языков для мультимедийного контента. Функции включают аудиотранскрипцию и перевод в реальном времени. Он также предлагает отличные возможности в математике, программировании и рассуждениях.
Версия E4B Gemma 3n — первая модель с менее чем 10 миллиардами параметров, которая преодолела отметку 1300 в тесте LMArena Elo. Gemma 3n доступна через Google AI Studio и другие инструменты разработки. Ее можно загрузить через Kaggle и Hugging Face.
Punto Informatico