使用 Firebase AI Logic 的 Gemini API
使用 Firebase AI Logic 搭配 Gemini 和 Imagen 模型构建 AI 赋能的移动应用、Web 应用和功能
Firebase AI Logic 可让您使用 Google 最新的生成式 AI 模型:Gemini 模型和 Imagen 模型。
如果您需要直接从移动应用或 Web 应用(而不是服务器端)调用 Gemini API 或 Imagen API,可以使用 Firebase AI Logic 客户端 SDK。这些客户端 SDK 专门用于移动应用和 Web 应用,可提供针对未经授权的客户端的安全选项,并与其他 Firebase 服务集成。
这些客户端 SDK 提供多种语言版本,包括适用于 Apple 平台的 Swift、适用于 Android 的 Kotlin 和 Java、适用于 Web 的 JavaScript、适用于 Flutter 的 Dart 以及 Unity。
借助这些客户端 SDK,您可以为应用添加 AI 个性化功能、构建 AI 聊天体验、创建 AI 赋能的优化和自动化功能等!
需要更高的灵活性或服务器端集成?
Genkit 是 Firebase 的开源框架,可用于复杂的服务器端 AI 开发,并可广泛访问 Google、OpenAI、Anthropic 等提供的模型。它包含更高级的 AI 功能和专用本地工具。
主要功能
多模态和自然语言输入 |
Gemini 模型是多模态模型,因此发送给 Gemini API 的提示可以包含文本、图片、PDF、视频和音频。部分 Gemini 模型还可以生成多模态输出。
Gemini 和 Imagen 模型都可以通过自然语言输入进行提示。 |
不断丰富的功能 | 借助这些 SDK,您可以直接从移动应用或 Web 应用调用 Gemini API 或 Imagen API,以构建 AI 对话体验、生成图片、使用工具(例如函数调用和基于 Google 搜索的 grounding)、以流式传输多模态输入和输出(包括音频)等。 |
生产应用的安全性和滥用防范 |
使用 Firebase App Check 有助于保护访问 Gemini 和 Imagen 模型的 API 免遭未经授权的客户端滥用。
Firebase AI Logic 默认情况下还具有每位用户的速率限制,并且这些每位用户的速率限制完全可配置。 |
强大的基础设施 | 充分利用专为移动应用和 Web 应用打造的可扩缩基础架构,例如使用 Cloud Storage for Firebase 管理文件、使用 Firebase 数据库产品(例如 Cloud Firestore)管理结构化数据,以及使用 Firebase Remote Config 动态设置运行时配置。 |
工作原理
Firebase AI Logic 提供客户端 SDK、代理服务和其他功能,让您能够访问 Google 的生成式 AI 模型,以便在移动应用和 Web 应用中构建 AI 功能。
支持 Google 模型和“Gemini API”提供商
我们支持所有最新的 Gemini 模型和 Imagen 3 模型,您可以选择自己偏好的“Gemini API”提供商来访问这些模型。 我们支持 Gemini Developer API 和 Vertex AI Gemini API。了解使用这两个 API 提供商之间的差异。
如果您选择使用 Gemini Developer API,则可以利用其“免费层级”快速开始使用。
移动和 Web 客户端 SDK
您可以使用我们的 Firebase AI Logic 客户端 SDK(适用于 Apple 平台的 Swift、Android 的 Kotlin 和 Java、Web 的 JavaScript、Flutter 的 Dart 和 Unity)直接从移动应用或 Web 应用向模型发送请求。
如果您已在 Firebase 项目中设置了这两个 Gemini API 提供方,只需启用另一个 API 并更改几行初始化代码,即可在 API 提供方之间切换。
此外,我们的 Web 版客户端 SDK 还提供对在桌面版 Chrome 上运行的 Web 应用的混合推理和设备端推理的实验性访问权限。此配置允许您的应用在设备端模型可用时使用该模型,但在需要时无缝回退到云端托管的模型。
代理服务
我们的代理服务充当客户端与您选择的 Gemini API 提供商(以及 Google 的模型)之间的网关。它提供对移动应用和 Web 应用至关重要的服务和集成。例如,您可以设置 Firebase App Check,以防止未经授权的客户端滥用您选择的 API 提供商和后端资源,从而有助于保护它们。
如果您选择使用 Gemini Developer API,这一点尤为重要,因为我们的代理服务和此 App Check 集成可确保您的 Gemini API 密钥保留在服务器上,而不会嵌入到应用的代码库中。
实现流程
设置 Firebase 项目并将应用连接到 Firebase | 使用 Firebase 控制台Firebase AI Logic 页面中的引导式工作流设置项目(包括为所选的 Gemini API 提供方启用必需的 API)、向 Firebase 项目注册应用,然后将 Firebase 配置添加到应用。 | |
安装 SDK 并进行初始化 | 安装特定于应用平台的 Firebase AI Logic SDK,然后在应用中初始化服务并创建模型实例。 | |
向 Gemini 和 Imagen 模型发送提示请求 | 使用 SDK 向 Gemini 模型发送纯文本提示或多模态提示,以生成文本和代码、结构化输出(如 JSON)和图片。
或者,您也可以提示 Imagen 模型生成图片。
利用多轮聊天、文本和音频的双向数据流以及函数调用,打造更丰富的体验。 |
|
为生产做好准备 | 为移动应用和 Web 应用实现重要集成,例如使用 Firebase App Check 保护 API 免遭滥用,以及使用 Firebase Remote Config 远程更新代码中的参数(例如模型名称)。 |
后续步骤
开始从移动应用或 Web 应用访问模型