Gemini API“免费层级”通过 API 服务提供,具有较低的速率限制,仅用于测试目的。在所有支持的国家/地区,Google AI Studio 的使用完全免费。Gemini API“付费层级”具有更高的速率限制、其他功能和不同的数据处理方式。
如果您希望降低费用,并且您的使用情形不需要立即获得实时响应,请查看批量模式。 批量模式旨在异步处理大量请求。使用此模式提交的请求的价格是交互式(非批处理模式)请求价格的 50%。
Gemini 2.5 Pro
Google 旗下先进的多用途模型,擅长处理编码和复杂的推理任务。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | 1.25 美元,提示 <= 20 万词元 2.50 美元,提示 > 20 万词元 |
输出价格(包括思考 token) | 免费 | 10.00 美元,提示 <= 20 万个令牌 15.00 美元,提示 > 20 万个令牌 |
上下文缓存价格 | 不可用 | $0.31,提示 <= 20 万个令牌 $0.625,提示 > 20 万个令牌 $4.50/100 万个令牌/小时(存储价格) |
使用 Google 搜索建立依据 | 不可用 | 1,500 RPD(免费),之后按每 1,000 个请求 $35 的价格收费 |
用于改进我们的产品 | 是 | 否 |
Gemini 2.5 Flash
我们的首个混合推理模型,支持 100 万个 token 的上下文窗口,并具有思考预算。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | $0.30(文字 / 图片 / 视频) $1.00(音频) |
输出价格(包括思考 token) | 免费 | $2.50 |
上下文缓存价格 | 不可用 | $0.075(文本 / 图片 / 视频) $0.25(音频) $1.00 / 每小时 1,000,000 个令牌(存储价格) |
使用 Google 搜索建立依据 | 免费,最多 500 个 RPD(与 Flash-Lite RPD 共用限额) | 1,500 RPD(免费,与 Flash-Lite RPD 共用限额),之后每 1,000 次请求 35 美元 |
Live API | 免费 | 输入:0.50 美元(文本)、3.00 美元(音频 / 图片 [视频]) 输出:2.00 美元(文本)、12.00 美元(音频) |
用于改进我们的产品 | 是 | 否 |
Gemini 2.5 Flash-Lite
Google 旗下最小巧且最具成本效益的模型,专为大规模使用而打造。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格(文字、图片、视频) | 免费 | $0.10(文字 / 图片 / 视频) $0.30(音频) |
输出价格(包括思考 token) | 免费 | $0.40 |
上下文缓存价格 | 不可用 | $0.025(文本/图片/视频) $0.125(音频) 每小时每 100 万个令牌$1.00(存储价格) |
使用 Google 搜索建立依据 | 免费,最多 500 个 RPD(与 Flash RPD 共用限额) | 1,500 RPD(免费,与 Flash RPD 共用限额),之后每 1,000 次请求收费 35 美元 |
用于改进我们的产品 | 是 | 否 |
Gemini 2.5 Flash 原生音频
我们的原生音频模型经过优化,可提供更高质量的音频输出,并具有更好的语速、语音自然度、冗余度和情绪。
预览版模型在稳定之前可能会发生变化,并且速率限制更严格。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 不可用 | $0.50(文字) $3.00(音频 / 视频) |
输出价格(包括思考 token) | 不可用 | $2.00(文字) $12.00(音频) |
用于改进我们的产品 | 是 | 否 |
Gemini 2.5 Flash 预览版 TTS
我们的 2.5 Flash 文字转语音音频模型经过优化,具有出色的性价比、低延迟和可控的语音生成功能。
预览版模型在稳定之前可能会发生变化,并且速率限制更严格。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | $0.50(文字) |
输出价格 | 免费 | 10.00 美元(音频) |
用于改进我们的产品 | 是 | 否 |
Gemini 2.5 Pro 预览版 TTS
我们的 2.5 Pro 文字转语音音频模型经过优化,可生成强大的低延迟语音,输出更自然,提示更易于引导。
预览版模型在稳定之前可能会发生变化,并且速率限制更严格。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 不可用 | $1.00(文字) |
输出价格 | 不可用 | 20.00 美元(音频) |
用于改进我们的产品 | 是 | 否 |
Gemini 2.0 Flash
Google 旗下最均衡的多模态模型,在所有任务中均表现出色,支持长达 100 万个 token 的上下文窗口,专为智能体时代而打造。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | $0.10(文字 / 图片 / 视频) $0.70(音频) |
输出价格 | 免费 | $0.40 |
上下文缓存价格 | 免费 | 0.025 美元 / 100 万个 token(文本/图片/视频) 0.175 美元 / 100 万个 token(音频) |
上下文缓存(存储) | 不可用 | 每小时每 100 万个令牌 $1.00 |
图片生成价格 | 免费 | 每张图片 $0.039* |
调整价格 | 不可用 | 不可用 |
使用 Google 搜索建立依据 | 免费,最多 500 个 RPD | 1,500 RPD(免费),之后按每 1,000 个请求 $35 的价格收费 |
Live API | 免费 | 输入:0.35 美元(文本)、2.10 美元(音频 / 图片 [视频]) 输出:1.50 美元(文本)、8.50 美元(音频) |
用于改进我们的产品 | 是 | 否 |
[*] 图片输出的费用为每 100 万个 token 30 美元。输出图片的最大尺寸为 1024x1024 像素,消耗 1290 个 token,相当于每张图片 $0.039。
Gemini 2.0 Flash-Lite
Google 旗下最小巧且最具成本效益的模型,专为大规模使用而打造。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | $0.075 |
输出价格 | 免费 | $0.30 |
上下文缓存价格 | 不可用 | 不可用 |
上下文缓存(存储) | 不可用 | 不可用 |
调整价格 | 不可用 | 不可用 |
使用 Google 搜索建立依据 | 不可用 | 不可用 |
用于改进我们的产品 | 是 | 否 |
Imagen 4 预览版
我们最新的图片生成模型,文本渲染效果和整体图片质量显著提升。
预览版模型在稳定之前可能会发生变化,并且速率限制更严格。
免费层级 | 付费层级,每张图片的价格(美元) | |
---|---|---|
Imagen 4 标准图片价格 | 不可用 | $0.04 |
Imagen 4 Ultra 图片价格 | 不可用 | $0.06 |
用于改进我们的产品 | 是 | 否 |
Imagen 3
我们先进的图像生成模型,适用于 Gemini API 付费层级的开发者。
免费层级 | 付费层级,每张图片的价格(美元) | |
---|---|---|
图片价格 | 不可用 | $0.03 |
用于改进我们的产品 | 是 | 否 |
Veo 3 预览版
我们的最新视频生成模型,适用于 Gemini API 付费层级的开发者。
免费层级 | 付费层级,每秒价格(以美元为单位) | |
---|---|---|
带音频的视频价格(默认) | 不可用 | $0.75 |
不含音频的视频价格 | 不可用 | $0.50 |
用于改进我们的产品 | 是 | 否 |
Veo 2
Google 先进的视频生成模型,适用于 Gemini API 付费层级的开发者。
免费层级 | 付费层级,每秒价格(以美元为单位) | |
---|---|---|
视频价格 | 不可用 | $0.35 |
用于改进我们的产品 | 是 | 否 |
Gemini 嵌入模型
我们最新的嵌入模型,比之前的版本更稳定,速率限制更高,可供 Gemini API 的免费层级和付费层级的开发者使用。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | $0.15 |
用于改进我们的产品 | 是 | 否 |
Gemma 3
我们的轻量级先进开放模型,采用与 Gemini 模型相同的技术构建而成。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | 不可用 |
输出价格 | 免费 | 不可用 |
上下文缓存价格 | 免费 | 不可用 |
上下文缓存(存储) | 免费 | 不可用 |
调整价格 | 不可用 | 不可用 |
使用 Google 搜索建立依据 | 不可用 | 不可用 |
用于改进我们的产品 | 是 | 否 |
Gemma 3n
我们打造的开放模型,可在手机、笔记本电脑和平板电脑等日常设备上实现高效性能。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | 不可用 |
输出价格 | 免费 | 不可用 |
上下文缓存价格 | 免费 | 不可用 |
上下文缓存(存储) | 免费 | 不可用 |
调整价格 | 不可用 | 不可用 |
使用 Google 搜索建立依据 | 不可用 | 不可用 |
用于改进我们的产品 | 是 | 否 |
Gemini 1.5 Flash
Google 旗下速度最快的多模态模型,在各种重复性任务中表现出色,上下文窗口支持 100 万个 token。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | $0.075,提示 <= 12.8 万个 token $0.15,提示 > 12.8 万个 token |
输出价格 | 免费 | $0.30,提示 <= 128, 000 个令牌 $0.60,提示 > 128, 000 个令牌 |
上下文缓存价格 | 免费,每小时最多可存储 100 万个令牌 | $0.01875,提示 <= 128, 000 个令牌 $0.0375,提示 > 128, 000 个令牌 |
上下文缓存(存储) | 免费 | $1.00/小时 |
调整价格 | 调优后的模型与未经调优的模型具有相同的令牌价格 调优服务免费。 |
调优后的模型与未经调优的模型具有相同的令牌价格 调优服务免费。 |
使用 Google 搜索建立依据 | 不可用 | 35 美元 / 1,000 次接地请求 |
用于改进我们的产品 | 是 | 否 |
Gemini 1.5 Flash-8B
我们最小的一款模型,适合对智能程度要求较低的使用场景,上下文窗口为 100 万个词元。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | $0.0375,提示 <= 128, 000 个令牌 $0.075,提示 > 128, 000 个令牌 |
输出价格 | 免费 | $0.15,提示 <= 128, 000 个 token $0.30,提示 > 128, 000 个 token |
上下文缓存价格 | 免费,每小时最多可存储 100 万个令牌 | $0.01,提示 <= 128, 000 个 token $0.02,提示 > 128, 000 个 token |
上下文缓存(存储) | 免费 | 每小时 $0.25 |
调整价格 | 调优后的模型与未经调优的模型具有相同的令牌价格 调优服务免费。 |
调优后的模型与未经调优的模型具有相同的令牌价格 调优服务免费。 |
使用 Google 搜索建立依据 | 不可用 | 35 美元 / 1,000 次接地请求 |
用于改进我们的产品 | 是 | 否 |
Gemini 1.5 Pro
我们智能程度最高的 Gemini 1.5 系列模型,具有突破性的 200 万个 token 上下文窗口。
免费层级 | 付费层级,每 100 万个令牌(美元) | |
---|---|---|
输入价格 | 免费 | 1.25 美元,提示 <= 128, 000 个 token 2.50 美元,提示 > 128, 000 个 token |
输出价格 | 免费 | 5.00 美元,提示 <= 12.8 万个 token 10.00 美元,提示 > 12.8 万个 token |
上下文缓存价格 | 不可用 | $0.3125,提示 <= 128, 000 个令牌 $0.625,提示 > 128, 000 个令牌 |
上下文缓存(存储) | 不可用 | 每小时 $4.50 |
调整价格 | 不可用 | 不可用 |
使用 Google 搜索建立依据 | 不可用 | 35 美元 / 1,000 次接地请求 |
用于改进我们的产品 | 是 | 否 |
[*] 在所有可用区域,Google AI Studio 的使用都是免费的。 如需了解详情,请参阅结算常见问题解答。
[**] 价格可能与此处列出的价格以及 Vertex AI 上提供的价格有所不同。如需了解 Vertex 价格,请参阅 Vertex AI 价格页面。
[***] 如果您使用动态检索来优化费用,则只有在响应中包含至少一个来自网络的 grounding 支持网址的请求才会产生“使用 Google 搜索进行 grounding”的费用。 Gemini 始终会产生费用。速率限制可能会发生变化。