Для мобильных и веб-приложений пакеты Firebase AI Logic SDK позволяют взаимодействовать с поддерживаемыми моделями Gemini и моделями Imagen непосредственно из вашего приложения.
Модели Gemini считаются мультимодальными , поскольку они способны обрабатывать и даже генерировать различные модальности, включая текст, код, PDF-файлы, изображения, видео и аудио. Модели Imagen могут генерировать изображения, используя текстовые подсказки.
В таблице ниже представлен краткий обзор поддерживаемых моделей Firebase AI Logic и их последних стабильных названий. В этой таблице также перечислены предварительные и экспериментальные модели, доступные для создания прототипов.
Также ознакомьтесь с нашими часто задаваемыми вопросами обо всех моделях, которые Firebase AI Logic поддерживает и не поддерживает.
Модели Близнецов
Модель | Вход | Выход | Описание |
---|---|---|---|
Модели Gemini со стабильными версиями | |||
Джемини 2.5 Проgemini-2.5-pro | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая продвинутая модель рассуждения, способная решать сложные проблемы. |
Близнецы 2.5 Флэшgemini-2.5-flash | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша модель мышления предлагает великолепные, комплексные возможности. Она разработана для достижения баланса между ценой и производительностью. |
Gemini 2.5 Flash‑Litegemini-2.5-flash-lite | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая сбалансированная модель Gemini , оптимизированная для случаев использования с низкой задержкой. |
Gemini 2.0 Flashgemini-2.0-flash-001 | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша мультимодальная модель с функциями нового поколения и улучшенными возможностями, включая превосходную скорость, встроенное использование инструментов и контекстное окно токенов размером 1 млн. |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001 | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Наша самая быстрая и экономичная модель Flash. Это вариант обновления для пользователей 1.5 Flash, которым нужно лучшее качество по той же цене и скорости. |
Модели Gemini , доступные только в виде предварительных и экспериментальных версий (рекомендуется использовать только для создания прототипов) | |||
Генерация Flash-изображений Gemini 2.0gemini-2.0-flash-preview-image-generation | текст, код, PDF-файлы, изображения, видео, аудио | изображения, текст и изображения | Наша многомодальная модель, которая поддерживает многомодальный ввод и вывод изображений. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09 | текст (потоковый), аудио (потоковое) | текст (потоковый), аудио (потоковое) | Наша многомодальная модель поддерживает потоковую передачу многомодальных входов и выходов в реальном времени с малой задержкой. |
1 Не поддерживается при использовании Gemini Developer API с Firebase AI Logic SDK.
Модели изображений
Модель | Вход | Выход | Описание |
---|---|---|---|
Модели Imagen со стабильными версиями | |||
Имидж 3imagen-3.0-generate-002 | текст | изображения | Создает реалистичные, высококачественные изображения на основе текстовых подсказок на естественном языке. |
Imagen 3 Fast 2imagen-3.0-fast-generate-001 | текст | изображения | Генерирует изображения для создания прототипов или использования с малой задержкой |
Модели Imagen только с предварительными и экспериментальными версиями (рекомендуется только для создания прототипов) | |||
Имидж 4imagen-4.0-generate-preview-06-06 | текст | изображения | Создает реалистичные, высококачественные изображения на основе текстовых подсказок на естественном языке. |
Imagen 4 Fast 2imagen-4.0-fast-generate-preview-06-06 | текст | изображения | Генерирует изображения для создания прототипов или использования с малой задержкой |
Imagen 4 Ultraimagen-4.0-ultra-generate-preview-06-06 | текст | изображения | Создает реалистичные, высококачественные изображения на основе текстовых подсказок на естественном языке. |
2 Эта модель Imagen не поддерживается API разработчика Gemini независимо от способа доступа к API.
Оставшаяся часть этой страницы содержит подробную информацию о моделях, поддерживаемых Firebase AI Logic .
- Поддерживаемый ввод и вывод
- Высокоуровневое сравнение поддерживаемых возможностей
- Характеристики и ограничения, например, максимальное количество входных токенов или максимальная длина входного видео.
Описание того, как создаются версии моделей , в частности их стабильные , автоматически обновляемые , предварительные и экспериментальные версии.
Списки доступных названий моделей для включения в код во время инициализации
Списки поддерживаемых языков для моделей
Внизу этой страницы вы можете просмотреть подробную информацию о старых моделях .
Сравнить модели
Каждая модель обладает различными возможностями для поддержки различных вариантов использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Firebase AI Logic . Каждая модель может обладать дополнительными возможностями, недоступными при использовании наших SDK.
Если вы не нашли нужную информацию в следующих подразделах, вы можете найти еще больше информации в документации выбранного вами поставщика API:
API разработчика Gemini : модели Gemini и модели Imagen
Vertex AI Gemini API : модели Gemini и модели Imagen
Поддерживаемый ввод и вывод
Ниже приведены поддерживаемые типы входных и выходных данных при использовании каждой модели с Firebase AI Logic :
Близнецы 2.5 Про | Близнецы 2.5 Вспышка | Близнецы 2.5 Flash- Лайт | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Имиджен | ||
---|---|---|---|---|---|---|---|---|---|
Типы входных данных | |||||||||
Текст | |||||||||
Текст (потоковый) | |||||||||
Код | |||||||||
Документы (PDF-файлы или обычный текст) | |||||||||
Изображения | |||||||||
Видео | |||||||||
Аудио | |||||||||
Аудио (потоковое) | |||||||||
Типы выходных данных | |||||||||
Текст | |||||||||
Текст (потоковый) | |||||||||
Код | |||||||||
Структурированный вывод (например, JSON) | |||||||||
Изображения | |||||||||
Аудио | |||||||||
Аудио (потоковое) |
Информацию о поддерживаемых типах файлов см. в разделе Поддерживаемые входные файлы и требования .
Поддерживаемые возможности и функции
Ниже перечислены поддерживаемые возможности и функции при использовании каждой модели с Firebase AI Logic :
Близнецы 2.5 Про | Близнецы 2.5 Вспышка | Близнецы 2.5 Flash- Лайт | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Имиджен | |
---|---|---|---|---|---|---|---|---|
Мышление | ||||||||
Генерация текста из текстовых или многомодальных входных данных | чередующийся или как часть изображения | только потоковая передача | ||||||
Генерировать изображения ( Близнецы или Имидж ) | ||||||||
Генерировать аудио | только потоковая передача | |||||||
Генерация структурированного вывода (например, JSON) | ||||||||
Анализировать документы (PDF-файлы или обычный текст) | ||||||||
Анализ изображений (зрение) | ||||||||
Анализ видео (зрение) | ||||||||
Анализировать аудио | только потоковая передача | |||||||
Многооборотный чат | ||||||||
Двунаправленный мультимодальный поток 1 | ||||||||
Вызов функции | ||||||||
Заземление с помощью поиска Google | ||||||||
Системные инструкции | ||||||||
Подсчет токенов |
Характеристики и ограничения
Ниже приведены характеристики и ограничения при использовании каждой модели с Firebase AI Logic :
Свойство | Близнецы 2.5 Про | Близнецы 2.5 Вспышка | Близнецы 2.5 Flash- Лайт | Близнецы 2.0 Флэш | Близнецы 2.0 Flash- Лайт | Близнецы 2.0 Флэш Генерация изображений | Близнецы 2.0 Flash- Жить | Имиджен |
---|---|---|---|---|---|---|---|---|
Контекстное окно * Общий лимит токенов (комбинированный вход+выход) | 1 048 576 токенов | 1 048 576 токенов | 1 048 576 токенов | 1 048 576 токенов | 1 048 576 токенов | 32,768 токенов | 32,768 токенов | 480 токенов |
Лимит выходных токенов * | 65 536 токенов | 65 536 токенов | 65 536 токенов | 8,192 токенов | 8,192 токенов | 8,192 токенов | 8,192 токенов | --- |
Дата окончания сбора знаний | Январь 2025 г. | Январь 2025 г. | Январь 2025 г. | Июнь 2024 г. | Июнь 2024 г. | Август 2024 г. | Август 2024 г. | --- |
PDF-файлы (по запросу) | ||||||||
Максимальное количество входных PDF-файлов ** | 3000 файлов | 3000 файлов | 3000 файлов | 3000 файлов | 3000 файлов | 3000 файлов | --- | --- |
Максимальное количество страниц за каждый входной PDF-файл ** | 1000 страниц | 1000 страниц | 1000 страниц | 1000 страниц | 1000 страниц | 1000 страниц | --- | --- |
Максимальный размер на каждый входной PDF-файл | 50 МБ | 50 МБ | 50 МБ | 50 МБ | 50 МБ | 50 МБ | --- | --- |
Изображения (по запросу) | ||||||||
Максимальное количество входных изображений | 3000 изображений | 3000 изображений | 3000 изображений | 3000 изображений | 3000 изображений | 3000 изображений | --- | --- |
Максимальное количество выходных изображений | --- | --- | --- | --- | --- | 10 изображений | --- | 4 изображения |
Максимальный размер на входное изображение, закодированное в формате base64 | 7 МБ | 7 МБ | 7 МБ | 7 МБ | 7 МБ | 7 МБ | --- | --- |
Видео (по запросу) | ||||||||
Максимальное количество входных видеофайлов | 10 файлов | 10 файлов | 10 файлов | 10 файлов | 10 файлов | 10 файлов | --- | --- |
Максимальная длина всех входных видео (только кадры) | ~60 минут | ~60 минут | ~60 минут | ~60 минут | ~60 минут | ~60 минут | --- | --- |
Максимальная длина всех входных видео (кадры+аудио) | ~45 минут | ~45 минут | ~45 минут | ~45 минут | ~45 минут | ~45 минут | --- | --- |
Аудио (по запросу) | ||||||||
Максимальное количество входных аудиофайлов | 1 файл | 1 файл | 1 файл | 1 файл | 1 файл | 1 файл | --- | --- |
Максимальное количество выходных аудиофайлов | --- | --- | --- | --- | --- | --- | --- | --- |
Максимальная длина всех входных аудиосигналов | ~8,4 часа | ~8,4 часа | ~8,4 часа | ~8,4 часа | ~8,4 часа | ~8,4 часа | --- | --- |
Максимальная длина всех выходных аудиосигналов | --- | --- | --- | --- | --- | --- | --- | --- |
* Для всех моделей Gemini токен эквивалентен примерно 4 символам, поэтому 100 токенов соответствуют примерно 60–80 английским словам. Для моделей Gemini общее количество токенов в запросах можно определить с помощью countTokens
.
** PDF-файлы обрабатываются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, поддерживаемых моделью.
Найти дополнительную подробную информацию
Квоты и цены различаются для каждой модели. Цена также зависит от входных и выходных данных.
Узнайте о поддерживаемых типах входных файлов, о том, как указать тип MIME и как убедиться, что ваши входные файлы и мультимодальные запросы соответствуют требованиям, а также о том, как следовать передовым практикам в разделе Поддерживаемые входные файлы и требования .
Модели управления версиями и именования
Модели доступны в стабильной , предварительной и экспериментальной версиях. Для удобства поддерживаются псевдонимы без явного указания версии.
Чтобы найти конкретные названия моделей для использования в вашем коде, см. раздел «Доступные названия моделей» далее на этой странице.
Тип версии / Стадия релиза | Описание | Шаблон названия модели | |
---|---|---|---|
Стабильный | Стабильные версии доступны и поддерживаются для использования в производственной среде, начиная с даты выпуска. Стабильная версия модели обычно выпускается с датой окончания срока службы, которая обозначает последний день, когда модель доступна. После этой даты модель больше не доступна и не поддерживается Google. |
| |
Автоматически обновляемый стабильный псевдоним (только модели Gemini 2.0 ) | Автоматически обновляемые стабильные псевдонимы всегда указывают на последнюю стабильную версию данной модели. При выходе новой стабильной версии автоматически обновляемый псевдоним автоматически начинает указывать на неё. | Только модели Gemini 2.0 Пример: | |
Предварительный просмотр | Предварительные версии обладают новыми возможностями и считаются нестабильными . Эти модели не рекомендуются для использования в производственной среде, имеют более строгие ограничения по скорости и могут иметь требования к выставлению счетов. Для API Vertex AI Gemini предварительные модели, выпущенные после июня 2025 года, обычно требуют установки | Названия моделей предварительных версий дополнены Пример: | |
Экспериментальный | Экспериментальные версии обладают новыми возможностями и считаются нестабильными . Эти модели не рекомендуются для использования в производственной среде и имеют более строгие ограничения по скорости. Экспериментальные модели предназначены для сбора отзывов и экспериментов с нашими новейшими функциями. Для API Vertex AI Gemini экспериментальные модели, выпущенные после июня 2025 года, требуют установки | Названия моделей экспериментальных версий дополнены Пример: | |
Ушедший на пенсию | Устаревшие версии уже вышли из эксплуатации и были окончательно деактивированы. Устаревшие модели больше не доступны и не поддерживаются Google, а запросы, ссылающиеся на идентификатор устаревшей модели, обычно возвращают ошибку 404. | --- |
Доступные названия моделей
Имена моделей — это явные значения, которые вы включаете в код во время инициализации модели.
Программно вывести список всех доступных моделей
Вы можете получить список всех доступных названий моделей, используя REST API:
API разработчика Gemini : вызов конечной точки
models.list
API Vertex AI Gemini : вызов конечной точки
publishers.models.list
Обратите внимание, что этот возвращаемый список будет включать все модели, поддерживаемые поставщиками API, но Firebase AI Logic поддерживает только модели Gemini и Imagen , описанные на этой странице. Также обратите внимание, что автоматически обновляемые псевдонимы (например, gemini-2.0-flash
) не перечислены, поскольку они являются вспомогательным псевдонимом для базовой модели.
Названия моделей Gemini
Примеры инициализации для вашей платформы см. в руководстве по началу работы .
Подробную информацию об этапах выпуска (особенно в части вариантов использования и выставления счетов) см. в разделе «Шаблоны управления версиями и именования моделей» .
Названия моделей Gemini 2.5 Pro
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-pro | Последняя стабильная версия Gemini 2.5 Pro | Стабильный | 2025-06-17 | Не ранее чем 2026-06-17 |
gemini-2.5-pro-preview-06-05 | (УДАЛЕНО) Предварительная версия, указывающая на последнюю стабильную версию Gemini 2.5 Pro (в настоящее время gemini-2.5-pro ) | Предварительный просмотр | 2025-06-05 | 2025-07-15 |
gemini-2.5-pro-preview-05-06 | (УДАЛЕНО) Предварительная версия, указывающая на последнюю стабильную версию Gemini 2.5 Pro (в настоящее время gemini-2.5-pro ) | Предварительный просмотр | 2025-05-06 | 2025-07-15 |
gemini-2.5-pro-preview-03-25 | (УДАЛЕНО) Предварительная версия, указывающая на последнюю стабильную версию Gemini 2.5 Pro (в настоящее время gemini-2.5-pro ) | Предварительный просмотр | 2025-03-25 | 2025-07-15 |
Названия моделей Gemini 2.5 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash | Последняя стабильная версия Gemini 2.5 Flash | Стабильный | 2025-06-17 | Не ранее чем 2026-06-17 |
gemini-2.5-flash-preview-05-20 | (УДАЛЕНО) Предварительная версия, указывающая на последнюю стабильную версию Gemini 2.5 Flash (в настоящее время gemini-2.5-flash ) | Предварительный просмотр | 2025-05-20 | 2025-07-15 |
gemini-2.5-flash-preview-04-17 | (УДАЛЕНО) Предварительная версия, указывающая на последнюю стабильную версию Gemini 2.5 Flash (в настоящее время gemini-2.5-flash ) | Предварительный просмотр | 2025-04-17 | 2025-07-15 |
Названия моделей Gemini 2.5 Flash‑Lite
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.5-flash-lite | Последняя стабильная версия Gemini 2.5 Flash‑Lite | Стабильный | 2025-07-22 | Не ранее чем 2026-07-22 |
gemini-2.5-flash-lite-preview-06-17 | Предварительная версия, указывающая на последнюю стабильную версию Gemini 2.5 Flash‑Lite (в настоящее время gemini-2.5-flash-lite ) | Предварительный просмотр | 2025-06-17 | 2025-08-21 |
Названия моделей Gemini 2.0 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-001 | Последняя стабильная версия Gemini 2.0 Flash | Стабильный | 2025-02-05 | Не ранее чем 2026-02-05 |
gemini-2.0-flash | Автоматически обновленный псевдоним, указывающий на последнюю стабильную версию Gemini 2.0 Flash (в настоящее время gemini-2.0-flash-001 ) | Стабильный | 2025-02-10 | --- |
Названия моделей Gemini 2.0 Flash‑Lite
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | Последняя стабильная версия Gemini 2.0 Flash‑Lite | Стабильный | 2025-02-25 | Не ранее чем 2026-02-25 |
gemini-2.0-flash-lite | Автоматически обновляемый псевдоним, указывающий на последнюю стабильную версию Gemini 2.0 Flash‑Lite (в настоящее время gemini-2.0-flash-lite-001 ) | Стабильный | 2025-02-25 | --- |
Названия моделей генерации изображений Flash Gemini 2.0
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 | Предварительная версия для создания Flash-изображений Gemini 2.0 | Предварительный просмотр | 2025-05-06 | Будет определено |
Названия моделей Gemini 2.0 Flash Live
Доступно только при использовании API Vertex AI Gemini в качестве поставщика API. |
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 | Предварительная версия для Gemini 2.0 Flash Live | Предварительный просмотр | 2025-04-09 | Будет определено |
1 Не поддерживается при использовании Gemini Developer API с Firebase AI Logic SDK.
Названия моделей Imagen
Примеры инициализации для вашей платформы см. в руководстве по созданию изображений с помощью Imagen .
Подробную информацию об этапах выпуска (особенно в части вариантов использования и выставления счетов) см. в разделе «Шаблоны управления версиями и именования моделей» .
Названия моделей Imagen 4
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-generate-preview-06-06 | Предварительная версия Imagen 4 | Предварительный просмотр | 2025-06-06 | Будет определено |
imagen-4.0-generate-preview-05-20 2 | Предварительная версия Imagen 4 | Предварительный просмотр | 2025-05-20 | Не ранее 2025-07-07 |
Названия моделей Imagen 4 Fast
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-fast-generate-preview-06-06 2 | Предварительная версия Imagen 4 Fast | Предварительный просмотр | 2025-06-06 | Будет определено |
Названия моделей Imagen 4 Ultra
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-4.0-ultra-generate-preview-06-06 | Предварительная версия Imagen 4 Ultra | Предварительный просмотр | 2025-06-06 | Будет определено |
imagen-4.0-ultra-generate-exp-05-20 2 | Экспериментальная версия Imagen 4 Ultra | Экспериментальный | 2025-05-20 | Не ранее 2025-07-07 |
Названия моделей Imagen 3
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-generate-002 | Последняя стабильная версия Imagen 3 | Стабильный | 2025-01-23 | Не ранее 23.01.2026 |
imagen-3.0-generate-001 2 | Первоначальная стабильная версия Imagen 3 | Стабильный | 2024-07-31 | Не ранее 31.07.2025 |
Названия моделей Imagen 3 Fast
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 | Первоначальная стабильная версия Imagen 3 Fast | Стабильный | 2024-07-31 | Не ранее 31.07.2025 |
2 Не поддерживается API разработчика Gemini независимо от способа доступа к API.
Поддерживаемые языки
Близнецы
Все модели Gemini понимают и могут отвечать на следующих языках:
Арабский (ar), бенгальский (bn), болгарский (bg), китайский упрощенный и традиционный (zh), хорватский (hr), чешский (cs), датский (da), голландский (nl), английский (en), эстонский (et), финский (fi), французский (fr), немецкий (de), греческий (el), иврит (iw), хинди (hi), венгерский (hu), индонезийский (id), итальянский (it), японский (ja), корейский (ko), латышский (lv), литовский (lt), норвежский (no), польский (pl), португальский (pt), румынский (ro), русский (ru), сербский (sr), словацкий (sk), словенский (sl), испанский (es), суахили (sw), шведский (sv), тайский (th), турецкий (tr), украинский (uk), вьетнамский (vi)
Модели Gemini 2.0 Flash , Gemini 1.5 Pro и Gemini 1.5 Flash могут понимать и отвечать на следующих дополнительных языках:
Африкаанс (af), амхарский (am), ассамский (as), азербайджанский (az), белорусский (be), боснийский (bs), каталанский (ca), кебуанский (ceb), корсиканский (co), валлийский (cy), дивехи (dv), эсперанто (eo), баскский (eu), персидский (fa), филиппинский (тагальский) (fil), фризский (fy), ирландский (ga), шотландский гэльский (gd), галисийский (gl), гуджарати (gu), хауса (ha), гавайский (haw), хмонг (hmn), гаитянский креольский (ht), армянский (hy), игбо (ig), исландский (is), яванский (jv), грузинский (ka), казахский (kk), кхмерский (km), каннада (kn), крио (kri), курдский (ku), кыргызский (ky), латынь (la), люксембургский (lb), лаосский (lo), Малагасийский (мг), маори (ми), македонский (mk), малаялам (ml), монгольский (mn), Meiteilon (Manipuri) (mni-Mtei), маратхи (mr), малайский (ms), мальтийский (mt), мьянманский (бирманский) (my), непальский (ne), ньянджа (чичева) (ny), одиа (ория) (или), пенджабский (pa), пушту (ps), синдхи (sd), сингальский (сингальский) (si), самоанский (sm), шона (sn), сомалийский (so), албанский (sq), сесото (st), суданский (su), тамильский (ta), телугу (te), таджикский (tg), уйгурский (ug), урду (ur), узбекский (uz), коса (xh), идиш (yi), йоруба (yo), зулу (zu)
Имиджен
Общая доступность : английский
Предварительный просмотр : китайский (упрощенный), китайский (традиционный), хинди, японский, корейский, португальский, испанский
Информация о старых моделях
Firebase AI Logic поддерживает старые активные модели Gemini (например, модели Gemini 1.5 ).
Firebase AI Logic не поддерживает старые модели Imagen (например, Imagen 2 ).
Модель | Вход | Выход | Оптимизировано для |
---|---|---|---|
Джемини 1.5 Проgemini-1.5-pro-002 | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Поддерживает сложные задачи на рассуждение, требующие большего интеллекта; контекст длиной 2 млн. |
Близнецы 1.5 Флэшgemini-1.5-flash-002 | текст, код, PDF-файлы, изображения, видео, аудио | текст, код, JSON | Обеспечивает быструю и универсальную производительность при выполнении самых разных задач |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
Это типы входных и выходных данных при использовании каждой модели с Firebase AI Logic :
Джемини 1.5 Про | Близнецы 1.5 Флэш | Gemini 1.0 Pro Vision | Джемини 1.0 Про | ||||
---|---|---|---|---|---|---|---|
Типы входных данных | |||||||
Текст | |||||||
Код | |||||||
Документы (PDF-файлы или обычный текст) | |||||||
Изображения | |||||||
Видео | |||||||
Аудио | |||||||
Аудио (потоковое) | |||||||
Типы выходных данных | |||||||
Текст | |||||||
Код | |||||||
Структурированный вывод (например, JSON) | |||||||
Изображения, видео и аудио |
Ниже приведены возможности и функции при использовании каждой модели с Firebase AI Logic :
Джемини 1.5 Про | Близнецы 1.5 Флэш | Gemini 1.0 Pro Vision | Джемини 1.0 Про | |
---|---|---|---|---|
Генерация текста из введенных данных | ||||
Генерация текста из многомодального ввода | ||||
Генерировать изображения | ||||
Генерировать аудио | ||||
Генерация структурированного вывода (например, JSON) | ||||
Анализировать документы (PDF-файлы или обычный текст) | ||||
Анализ изображений (зрение) | ||||
Анализ видео (зрение) | ||||
Анализировать аудио | ||||
Многооборотный чат | ||||
Вызов функций (инструменты) | ||||
Подсчет токенов и оплачиваемых символов | ||||
Системные инструкции | ||||
Двунаправленная мультимодальная потоковая передача |
Ниже приведены характеристики и ограничения при использовании каждой модели с Firebase AI Logic :
Джемини 1.5 Про | Близнецы 1.5 Флэш | Gemini 1.0 Pro Vision | Джемини 1.0 Про | ||||
---|---|---|---|---|---|---|---|
Контекстное окно * Общий лимит токенов (комбинированный вход+выход) | 2 097 152 токенов | 1 048 576 токенов | 16 384 токенов | 32,760 токенов | |||
Лимит выходных токенов * | 8,192 токенов | 8,192 токенов | 2048 токенов | 8,192 токенов | |||
Дата окончания сбора знаний | Май 2024 г. | Май 2024 г. | Февраль 2023 г. | Февраль 2023 г. | |||
PDF-файлы (по запросу) | |||||||
Максимальное количество входных PDF-файлов ** | 3000 файлов | 3000 файлов | 16 файлов | --- | |||
Максимальное количество страниц во входном PDF-файле ** | 1000 страниц | 1000 страниц | 16 страниц | --- | |||
Максимальный размер на каждый входной PDF-файл | 50 МБ | 50 МБ | 50 МБ | --- | |||
Изображения (по запросу) | |||||||
Максимальное количество входных изображений | 3000 изображений | 3000 изображений | 16 изображений | --- | |||
Максимальное количество выходных изображений | --- | --- | --- | --- | |||
Максимальный размер на входное изображение, закодированное в формате base64 | 7 МБ | 7 МБ | 7 МБ | --- | |||
Видео (по запросу) | |||||||
Максимальное количество входных видеофайлов | 10 файлов | 10 файлов | 1 файл | --- | |||
Максимальная длина всех входных видео (только кадры) | ~60 минут | ~60 минут | 2 минуты | --- | |||
Максимальная длина всех входных видео (кадры+аудио) | ~45 минут | ~45 минут | --- | --- | |||
Аудио (по запросу) | |||||||
Максимальное количество входных аудиофайлов | 1 файл | 1 файл | --- | --- | |||
Максимальное количество выходных аудиофайлов | --- | --- | --- | --- | |||
Максимальная длина всех входных аудиосигналов | ~8,4 часа | ~8,4 часа | --- | --- | |||
Максимальная длина всех выходных аудиосигналов | --- | --- | --- | --- |
* Для всех моделей Gemini токен эквивалентен примерно 4 символам, поэтому 100 токенов соответствуют примерно 60–80 английским словам. Для моделей Gemini общее количество токенов в запросах можно определить с помощью countTokens
.
** PDF-файлы обрабатываются как изображения, поэтому одна страница PDF-файла рассматривается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, поддерживаемых моделью.
Имена моделей — это явные значения, которые вы включаете в код во время инициализации модели.
Названия моделей Gemini 1.5 Pro
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.5-pro-002 | Последняя стабильная версия Gemini 1.5 Pro | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | Первоначальная стабильная версия Gemini 1.5 Pro | Предстоящий выход на пенсию | 2024-05-24 | 2025-05-24 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.5-pro | Указывает на последнюю стабильную версию 1.5 Pro (в настоящее время gemini-1.5-pro-002 ) | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
Названия моделей Gemini 1.5 Flash
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.5-flash-002 | Последняя стабильная версия Gemini 1.5 Flash | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | Первоначальная стабильная версия Gemini 1.5 Flash | Предстоящий выход на пенсию | 2024-05-24 | 2025-05-24 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.5-flash | Указывает на последнюю стабильную версию 1.5 Flash (в настоящее время gemini-1.5-flash-002 ) | Предстоящий выход на пенсию | 2024-09-24 | 2025-09-24 |
Названия моделей Gemini 1.0 Pro Vision
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.0-pro-vision-001 | Последняя стабильная версия Gemini 1.0 Pro Vision | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.0-pro-vision | Указывает на последнюю стабильную версию 1.5 Pro Vision (в настоящее время gemini-1.5-pro-vision-001 ) | Ушедший на пенсию | 2024-01-04 | 2025-04-21 |
Названия моделей Gemini 1.0 Pro
Название модели | Описание | Стадия релиза | Дата выпуска | Дата выхода на пенсию |
---|---|---|---|---|
Стабильные версии | ||||
gemini-1.0-pro-002 | Последняя стабильная версия Gemini 1.0 Pro | Ушедший на пенсию | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 | Стабильная версия Gemini 1.0 Pro | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Автоматически обновляемый стабильный псевдоним | ||||
gemini-1.0-pro | Указывает на последнюю стабильную версию 1.0 Pro (в настоящее время gemini-1.0-pro-002 ) | Ушедший на пенсию | 2024-02-15 | 2025-04-21 |
Следующие шаги
Попробуйте возможности API Gemini
- Создавайте многовариантные беседы (чаты) .
- Генерация текста из текстовых подсказок .
- Сгенерируйте текст, используя различные типы файлов, такие как изображения , PDF-файлы , видео и аудио .
- Генерируйте структурированный вывод (например, JSON) из текстовых и многомодальных запросов.
- Генерация изображений из текстовых подсказок ( Gemini или Imagen ).
- Потоковая передача входных и выходных данных (включая аудио) с использованием Gemini Live API .
- Используйте инструменты (например, вызов функций и привязку к Google Search ) для подключения модели Gemini к другим частям вашего приложения, внешним системам и информации.