常见用途
提供实时推理支持
使用 Cloud Run GPU 为 Gemma 3、Llama 3.2 或自定义微调模型等开源模型提供实时推理支持。构建聊天机器人、即时生成文档摘要,等等,同时还能扩容以应对不可预测的流量高峰。或者,通过在 Cloud Run functions 上使用 GPU,数据科学家可以运行 Python 脚本,进行事件驱动的推理,无需过多了解底层基础架构。
提供实时推理支持
使用 Cloud Run GPU 为 Gemma 3、Llama 3.2 或自定义微调模型等开源模型提供实时推理支持。构建聊天机器人、即时生成文档摘要,等等,同时还能扩容以应对不可预测的流量高峰。或者,通过在 Cloud Run functions 上使用 GPU,数据科学家可以运行 Python 脚本,进行事件驱动的推理,无需过多了解底层基础架构。
价格
Cloud Run 定价方式 | 按量付费,包含一个“始终免费”层级,计费时间以 100 毫秒为增量向上取整。如果您不使用,就无需付费。 | |
---|---|---|
SKU | 超出免费层级的无折扣价格 | 免费 |
CPU | $0.00001800 / vCPU 秒 | 每月前 24 万 vCPU 秒免费 |
内存 | $0.00000200 / GiB 秒 | 每月前 45 万 GiB 秒免费 |