Представляем Gemini: наша самая большая и самая мощная модель ИИ

Оригинальный источник: Dec 06, 2023, Sundar Pichai, Demis Hassabis

Заметка от генерального директора Google и Alphabet Сундара Пичаи:

Каждый технологический переход - это возможность для продвижения научных открытий, ускорения человеческого прогресса и улучшения жизни. Я верю, что переход, который мы видим сейчас с ИИ, будет самым значительным в нашей жизни, намного больше, чем переход к мобильным устройствам или к интернету до этого.

Вот что волнует меня: возможность сделать ИИ полезным для всех, везде в мире.

Почти восемь лет в пути как компании, ориентированной на ИИ, темпы прогресса только ускоряются: миллионы людей теперь используют генеративный ИИ в наших продуктах для выполнения задач, которые они даже год назад не могли выполнять.

Теперь мы делаем следующий шаг в нашем пути с Gemini, нашей самой способной и общей моделью на данный момент, с передовыми показателями по многим ведущим критериям. Наша первая версия, Gemini 1.0, оптимизирована для разных размеров: Ultra, Pro и Nano.

– Сундар

Представляем Gemini

От Демиса Хассабиса, генерального директора и сооснователя Google DeepMind

Сегодня мы на шаг ближе к этому видению, поскольку представляем Gemini, самую способную и общую модель, которую мы когда-либо создавали.

Gemini — это результат масштабных совместных усилий команд по всему Google. Она была создана с нуля как мультимодальная, что означает, что она может обобщать и беспрепятственно понимать, работать с различными типами информации, включая текст, код, аудио, изображения и видео, и комбинировать их.

Мы оптимизировали Gemini 1.0 для трех различных размеров:

Gemini Ultra — наша самая большая и мощная модель для высокосложных задач.
Gemini Pro — наша лучшая модель для масштабирования в широком диапазоне задач.
Gemini Nano — наша самая эффективная модель для задач, выполняемых на устройстве.

Передовая производительность

С результатом в 90,0%, Gemini Ultra стала первой моделью, превзошедшей экспертов-людей по MMLU (массовое многофункциональное понимание языка).

Gemini Ultra также достигает передового результата в 59,4% на новом бенчмарке MMMU, который состоит из мультимодальных задач, охватывающих различные области и требующих осознанного рассуждения.

Возможности следующего поколения

Мы разработали Gemini как изначально мультимодальную, обученную с самого начала на различных модальностях. Это помогает Gemini беспрепятственно понимать и рассуждать о всех видах входных данных с самого начала, намного лучше, чем существующие мультимодальные модели.

Сложное рассуждение

Сложные мультимодальные рассуждения Gemini 1.0 могут помочь понять сложную письменную и визуальную информацию. Это делает её уникально способной на выявление знаний, которые могут быть трудными для различения на фоне огромных объемов данных.

Продвинутое программирование

Наша первая версия Gemini может понимать, объяснять и генерировать высококачественный код на самых популярных языках программирования, таких как Python, Java, C++ и Go.

Используя специализированную версию Gemini, мы создали более продвинутую систему генерации кода, AlphaCode 2, которая превосходно справляется с решением задач конкурентного программирования.

Внедрение Gemini в мир

Gemini 1.0 теперь внедряется в ряд продуктов и платформ. Начиная с сегодняшнего дня, Bard будет использовать настроенную версию Gemini Pro для более продвинутого рассуждения, планирования, понимания и многого другого.

Мы также привносим Gemini в Pixel. Pixel 8 Pro — первый смартфон, спроектированный для работы с Gemini Nano.

Эра Gemini: обеспечение будущего инноваций

Это значительный веха в развитии ИИ и начало новой эры для нас в Google, поскольку мы продолжаем быстро инновировать и ответственно расширять возможности наших моделей.

Перевел Pavel Valentov

← Вернуться в блог