Veo 3 现已在 Gemini API 中提供！了解详情

此页面由 Cloud Translation API 翻译。

Gemini Developer API 价格

Gemini API“免费层级”通过 API 服务提供，具有较低的速率限制，仅用于测试目的。在所有支持的国家/地区，Google AI Studio 的使用完全免费。Gemini API“付费层级”具有更高的速率限制、其他功能和不同的数据处理方式。

升级到付费层级

如果您希望降低费用，并且您的使用情形不需要立即获得实时响应，请查看批量模式。批量模式旨在异步处理大量请求。使用此模式提交的请求的价格是交互式（非批处理模式）请求价格的 50%。

Gemini 2.5 Pro

在 Google AI Studio 中试用

Google 旗下先进的多用途模型，擅长处理编码和复杂的推理任务。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	1.25 美元，提示 <= 20 万词元 2.50 美元，提示 > 20 万词元
输出价格（包括思考 token）	免费	10.00 美元，提示 <= 20 万个令牌 15.00 美元，提示 > 20 万个令牌
上下文缓存价格	不可用	$0.31，提示 <= 20 万个令牌 $0.625，提示 > 20 万个令牌 $4.50/100 万个令牌/小时（存储价格）
使用 Google 搜索建立依据	不可用	1,500 RPD（免费），之后按每 1,000 个请求 $35 的价格收费
用于改进我们的产品	是	否

Gemini 2.5 Flash

在 Google AI Studio 中试用

我们的首个混合推理模型，支持 100 万个 token 的上下文窗口，并具有思考预算。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	$0.30（文字 / 图片 / 视频） $1.00（音频）
输出价格（包括思考 token）	免费	$2.50
上下文缓存价格	不可用	$0.075（文本 / 图片 / 视频） $0.25（音频） $1.00 / 每小时 1,000,000 个令牌（存储价格）
使用 Google 搜索建立依据	免费，最多 500 个 RPD（与 Flash-Lite RPD 共用限额）	1,500 RPD（免费，与 Flash-Lite RPD 共用限额），之后每 1,000 次请求 35 美元
Live API	免费	输入：0.50 美元（文本）、3.00 美元（音频 / 图片 [视频]）输出：2.00 美元（文本）、12.00 美元（音频）
用于改进我们的产品	是	否

Gemini 2.5 Flash-Lite

在 Google AI Studio 中试用

Google 旗下最小巧且最具成本效益的模型，专为大规模使用而打造。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格（文字、图片、视频）	免费	$0.10（文字 / 图片 / 视频） $0.30（音频）
输出价格（包括思考 token）	免费	$0.40
上下文缓存价格	不可用	$0.025（文本/图片/视频） $0.125（音频）每小时每 100 万个令牌$1.00（存储价格）
使用 Google 搜索建立依据	免费，最多 500 个 RPD（与 Flash RPD 共用限额）	1,500 RPD（免费，与 Flash RPD 共用限额），之后每 1,000 次请求收费 35 美元
用于改进我们的产品	是	否

Gemini 2.5 Flash 原生音频

在 Google AI Studio 中试用

我们的原生音频模型经过优化，可提供更高质量的音频输出，并具有更好的语速、语音自然度、冗余度和情绪。

预览版模型在稳定之前可能会发生变化，并且速率限制更严格。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	不可用	$0.50（文字） $3.00（音频 / 视频）
输出价格（包括思考 token）	不可用	$2.00（文字） $12.00（音频）
用于改进我们的产品	是	否

Gemini 2.5 Flash 预览版 TTS

在 Google AI Studio 中试用

我们的 2.5 Flash 文字转语音音频模型经过优化，具有出色的性价比、低延迟和可控的语音生成功能。

预览版模型在稳定之前可能会发生变化，并且速率限制更严格。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	$0.50（文字）
输出价格	免费	10.00 美元（音频）
用于改进我们的产品	是	否

Gemini 2.5 Pro 预览版 TTS

在 Google AI Studio 中试用

我们的 2.5 Pro 文字转语音音频模型经过优化，可生成强大的低延迟语音，输出更自然，提示更易于引导。

预览版模型在稳定之前可能会发生变化，并且速率限制更严格。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	不可用	$1.00（文字）
输出价格	不可用	20.00 美元（音频）
用于改进我们的产品	是	否

Gemini 2.0 Flash

在 Google AI Studio 中试用

Google 旗下最均衡的多模态模型，在所有任务中均表现出色，支持长达 100 万个 token 的上下文窗口，专为智能体时代而打造。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	$0.10（文字 / 图片 / 视频） $0.70（音频）
输出价格	免费	$0.40
上下文缓存价格	免费	0.025 美元 / 100 万个 token（文本/图片/视频） 0.175 美元 / 100 万个 token（音频）
上下文缓存（存储）	不可用	每小时每 100 万个令牌 $1.00
图片生成价格	免费	每张图片 $0.039*
调整价格	不可用	不可用
使用 Google 搜索建立依据	免费，最多 500 个 RPD	1,500 RPD（免费），之后按每 1,000 个请求 $35 的价格收费
Live API	免费	输入：0.35 美元（文本）、2.10 美元（音频 / 图片 [视频]）输出：1.50 美元（文本）、8.50 美元（音频）
用于改进我们的产品	是	否

[*] 图片输出的费用为每 100 万个 token 30 美元。输出图片的最大尺寸为 1024x1024 像素，消耗 1290 个 token，相当于每张图片 $0.039。

Gemini 2.0 Flash-Lite

在 Google AI Studio 中试用

Google 旗下最小巧且最具成本效益的模型，专为大规模使用而打造。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	$0.075
输出价格	免费	$0.30
上下文缓存价格	不可用	不可用
上下文缓存（存储）	不可用	不可用
调整价格	不可用	不可用
使用 Google 搜索建立依据	不可用	不可用
用于改进我们的产品	是	否

Imagen 4 预览版

在 Google AI Studio 中试用

我们最新的图片生成模型，文本渲染效果和整体图片质量显著提升。

预览版模型在稳定之前可能会发生变化，并且速率限制更严格。

	免费层级	付费层级，每张图片的价格（美元）
Imagen 4 标准图片价格	不可用	$0.04
Imagen 4 Ultra 图片价格	不可用	$0.06
用于改进我们的产品	是	否

Imagen 3

在 Google AI Studio 中试用

我们先进的图像生成模型，适用于 Gemini API 付费层级的开发者。

	免费层级	付费层级，每张图片的价格（美元）
图片价格	不可用	$0.03
用于改进我们的产品	是	否

Veo 3 预览版

试用 Veo 3

我们的最新视频生成模型，适用于 Gemini API 付费层级的开发者。

	免费层级	付费层级，每秒价格（以美元为单位）
带音频的视频价格（默认）	不可用	$0.75
不含音频的视频价格	不可用	$0.50
用于改进我们的产品	是	否

Veo 2

试用 API

Google 先进的视频生成模型，适用于 Gemini API 付费层级的开发者。

	免费层级	付费层级，每秒价格（以美元为单位）
视频价格	不可用	$0.35
用于改进我们的产品	是	否

Gemini 嵌入模型

试用 API

我们最新的嵌入模型，比之前的版本更稳定，速率限制更高，可供 Gemini API 的免费层级和付费层级的开发者使用。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	$0.15
用于改进我们的产品	是	否

Gemma 3

试用 Gemma 3

我们的轻量级先进开放模型，采用与 Gemini 模型相同的技术构建而成。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	不可用
输出价格	免费	不可用
上下文缓存价格	免费	不可用
上下文缓存（存储）	免费	不可用
调整价格	不可用	不可用
使用 Google 搜索建立依据	不可用	不可用
用于改进我们的产品	是	否

Gemma 3n

试用 Gemma 3n

我们打造的开放模型，可在手机、笔记本电脑和平板电脑等日常设备上实现高效性能。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	不可用
输出价格	免费	不可用
上下文缓存价格	免费	不可用
上下文缓存（存储）	免费	不可用
调整价格	不可用	不可用
使用 Google 搜索建立依据	不可用	不可用
用于改进我们的产品	是	否

Gemini 1.5 Flash

在 Google AI Studio 中试用

Google 旗下速度最快的多模态模型，在各种重复性任务中表现出色，上下文窗口支持 100 万个 token。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	$0.075，提示 <= 12.8 万个 token $0.15，提示 > 12.8 万个 token
输出价格	免费	$0.30，提示 <= 128, 000 个令牌 $0.60，提示 > 128, 000 个令牌
上下文缓存价格	免费，每小时最多可存储 100 万个令牌	$0.01875，提示 <= 128, 000 个令牌 $0.0375，提示 > 128, 000 个令牌
上下文缓存（存储）	免费	$1.00/小时
调整价格	调优后的模型与未经调优的模型具有相同的令牌价格调优服务免费。	调优后的模型与未经调优的模型具有相同的令牌价格调优服务免费。
使用 Google 搜索建立依据	不可用	35 美元 / 1,000 次接地请求
用于改进我们的产品	是	否

Gemini 1.5 Flash-8B

在 Google AI Studio 中试用

我们最小的一款模型，适合对智能程度要求较低的使用场景，上下文窗口为 100 万个词元。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	$0.0375，提示 <= 128, 000 个令牌 $0.075，提示 > 128, 000 个令牌
输出价格	免费	$0.15，提示 <= 128, 000 个 token $0.30，提示 > 128, 000 个 token
上下文缓存价格	免费，每小时最多可存储 100 万个令牌	$0.01，提示 <= 128, 000 个 token $0.02，提示 > 128, 000 个 token
上下文缓存（存储）	免费	每小时 $0.25
调整价格	调优后的模型与未经调优的模型具有相同的令牌价格调优服务免费。	调优后的模型与未经调优的模型具有相同的令牌价格调优服务免费。
使用 Google 搜索建立依据	不可用	35 美元 / 1,000 次接地请求
用于改进我们的产品	是	否

Gemini 1.5 Pro

在 Google AI Studio 中试用

我们智能程度最高的 Gemini 1.5 系列模型，具有突破性的 200 万个 token 上下文窗口。

	免费层级	付费层级，每 100 万个令牌（美元）
输入价格	免费	1.25 美元，提示 <= 128, 000 个 token 2.50 美元，提示 > 128, 000 个 token
输出价格	免费	5.00 美元，提示 <= 12.8 万个 token 10.00 美元，提示 > 12.8 万个 token
上下文缓存价格	不可用	$0.3125，提示 <= 128, 000 个令牌 $0.625，提示 > 128, 000 个令牌
上下文缓存（存储）	不可用	每小时 $4.50
调整价格	不可用	不可用
使用 Google 搜索建立依据	不可用	35 美元 / 1,000 次接地请求
用于改进我们的产品	是	否

[*] 在所有可用区域，Google AI Studio 的使用都是免费的。如需了解详情，请参阅结算常见问题解答。

[**] 价格可能与此处列出的价格以及 Vertex AI 上提供的价格有所不同。如需了解 Vertex 价格，请参阅 Vertex AI 价格页面。

[***] 如果您使用动态检索来优化费用，则只有在响应中包含至少一个来自网络的 grounding 支持网址的请求才会产生“使用 Google 搜索进行 grounding”的费用。 Gemini 始终会产生费用。速率限制可能会发生变化。