Giá của API dành cho nhà phát triển Gemini

"Bậc miễn phí" của Gemini API được cung cấp thông qua dịch vụ API với giới hạn tốc độ thấp hơn cho mục đích kiểm thử. Bạn có thể sử dụng Google AI Studio hoàn toàn miễn phí ở tất cả các quốc gia được hỗ trợ. "Cấp có tính phí" của Gemini API có hạn mức tốc độ cao hơn, các tính năng bổ sung và cách xử lý dữ liệu khác.

Nếu bạn muốn giảm chi phí và trường hợp sử dụng của bạn không yêu cầu phản hồi ngay lập tức theo thời gian thực, hãy xem Chế độ hàng loạt. Chế độ hàng loạt được thiết kế để xử lý một số lượng lớn các yêu cầu không đồng bộ. Các yêu cầu được gửi bằng chế độ này có giá bằng 50% giá của các yêu cầu tương tác (chế độ không theo lô).

Mô hình đa năng tiên tiến nhất của chúng tôi, có khả năng vượt trội trong việc lập trình và giải quyết các nhiệm vụ suy luận phức tạp.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí 1,25 USD, câu lệnh <= 200.000 mã thông báo
2,5 USD, câu lệnh > 200.000 mã thông báo
Giá đầu ra (bao gồm cả mã thông báo suy nghĩ) Miễn phí 10 USD, câu lệnh <= 200.000 mã thông báo
15 USD, câu lệnh > 200.000
Giá trong bộ nhớ đệm theo bối cảnh Không có 0,31 USD, câu lệnh <= 200.000 mã thông báo
0,625 USD, câu lệnh > 200.000 mã thông báo
4,5 USD / 1.000.000 mã thông báo mỗi giờ (giá lưu trữ)
Tìm trong phần liên kết thực tế bằng Google Tìm kiếm Không có 1.500 RPD (miễn phí), sau đó là 35 USD / 1.000 yêu cầu
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Mô hình suy luận kết hợp đầu tiên của chúng tôi hỗ trợ cửa sổ ngữ cảnh 1 triệu token và có ngân sách tư duy.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí 0,30 USD (văn bản / hình ảnh / video)
1 USD (âm thanh)
Giá đầu ra (bao gồm cả mã thông báo suy nghĩ) Miễn phí $2,50
Giá trong bộ nhớ đệm theo bối cảnh Không có 0,075 USD (văn bản / hình ảnh / video)
0,25 USD (âm thanh)
1 USD / 1.000.000 mã thông báo mỗi giờ (giá lưu trữ)
Tìm trong phần liên kết thực tế bằng Google Tìm kiếm Miễn phí, tối đa 500 RPD (giới hạn này được chia sẻ với RPD của Flash-Lite) 1.500 RPD (miễn phí, hạn mức dùng chung với RPD Flash-Lite), sau đó là 35 USD / 1.000 yêu cầu
Live API Miễn phí Đầu vào: 0,5 USD (văn bản), 3 USD (âm thanh / hình ảnh [video])
Đầu ra: 2 USD (văn bản), 12 USD (âm thanh)
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Gemini 2.5 Flash-Lite

Dùng thử trong Google AI Studio

Mô hình nhỏ nhất và tiết kiệm chi phí nhất của chúng tôi, được thiết kế để sử dụng ở quy mô lớn.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Giá nhập (văn bản, hình ảnh, video) Miễn phí 0,10 USD (văn bản / hình ảnh / video)
0,30 USD (âm thanh)
Giá đầu ra (bao gồm cả mã thông báo suy nghĩ) Miễn phí $0,40
Giá trong bộ nhớ đệm theo bối cảnh Không có 0,025 USD (văn bản / hình ảnh / video)
0,125 USD (âm thanh)
1 USD / 1.000.000 mã thông báo mỗi giờ (giá lưu trữ)
Tìm trong phần liên kết thực tế bằng Google Tìm kiếm Miễn phí, tối đa 500 RPD (giới hạn này được chia sẻ với RPD của Flash) 1.500 RPD (miễn phí, hạn mức dùng chung với Flash RPD), sau đó là $35 / 1.000 yêu cầu
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Âm thanh gốc của Gemini 2.5 Flash

Dùng thử trong Google AI Studio

Các mô hình âm thanh gốc của chúng tôi được tối ưu hoá để mang đến đầu ra âm thanh chất lượng cao hơn với nhịp điệu, giọng nói tự nhiên, mức độ chi tiết và tâm trạng tốt hơn.

Các mô hình xem trước có thể thay đổi trước khi trở nên ổn định và có giới hạn tốc độ hạn chế hơn.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Không có 0,5 USD (văn bản)
3 USD (âm thanh / video)
Giá đầu ra (bao gồm cả mã thông báo suy nghĩ) Không có 2 USD (văn bản)
12 USD (âm thanh)
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Bản xem trước Gemini 2.5 Flash TTS

Dùng thử trong Google AI Studio

Mô hình âm thanh chuyển văn bản sang lời nói 2.5 Flash được tối ưu hoá để tạo lời nói có thể kiểm soát, độ trễ thấp và hiệu suất cao so với giá.

Các mô hình xem trước có thể thay đổi trước khi trở nên ổn định và có giới hạn tốc độ hạn chế hơn.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí 0,5 USD (văn bản)
Giá đầu ra Miễn phí 10 USD (âm thanh)
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Gemini 2.5 Pro Preview TTS

Dùng thử trong Google AI Studio

Mô hình âm thanh chuyển văn bản sang lời nói 2.5 Pro của chúng tôi được tối ưu hoá để tạo lời nói mạnh mẽ, có độ trễ thấp, mang lại kết quả tự nhiên hơn và dễ dàng điều hướng các câu lệnh.

Các mô hình xem trước có thể thay đổi trước khi trở nên ổn định và có giới hạn tốc độ hạn chế hơn.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Không có 1 đô la Mỹ (văn bản)
Giá đầu ra Không có 200.000 VND (âm thanh)
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Mô hình đa phương thức cân bằng nhất của chúng tôi, có hiệu suất tuyệt vời trong mọi tác vụ, với cửa sổ ngữ cảnh 1 triệu token và được xây dựng cho kỷ nguyên của các Đặc vụ.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí 0,10 USD (văn bản / hình ảnh / video)
0,70 USD (âm thanh)
Giá đầu ra Miễn phí $0,40
Giá trong bộ nhớ đệm theo bối cảnh Miễn phí 0,025 USD / 1.000.000 mã thông báo (văn bản/hình ảnh/video)
0,175 USD / 1.000.000 mã thông báo (âm thanh)
Lưu vào bộ nhớ đệm theo bối cảnh (bộ nhớ) Không có 1 USD / 1.000.000 mã thông báo mỗi giờ
Giá tạo hình ảnh Miễn phí 0,039 USD cho mỗi hình ảnh*
Giá điều chỉnh Không có Không có
Tìm trong phần liên kết thực tế bằng Google Tìm kiếm Miễn phí, tối đa 500 RPD 1.500 RPD (miễn phí), sau đó là 35 USD / 1.000 yêu cầu
Live API Miễn phí Đầu vào: $0,35 (văn bản), $2,10 (âm thanh / hình ảnh [video])
Đầu ra: $1,50 (văn bản), $8,50 (âm thanh)
Được dùng để cải thiện các sản phẩm của chúng tôi Không

[*] Đầu ra là hình ảnh có giá 30 USD cho mỗi 1.000.000 mã thông báo. Hình ảnh đầu ra có kích thước tối đa 1024x1024px sẽ tiêu thụ 1290 mã thông báo và tương đương với 0,039 USD cho mỗi hình ảnh.

Gemini 2.0 Flash-Lite

Dùng thử trong Google AI Studio

Mô hình nhỏ nhất và tiết kiệm chi phí nhất của chúng tôi, được thiết kế để sử dụng ở quy mô lớn.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí 0,075 USD
Giá đầu ra Miễn phí 0,3 USD
Giá trong bộ nhớ đệm theo bối cảnh Không có Không có
Lưu vào bộ nhớ đệm theo bối cảnh (bộ nhớ) Không có Không có
Giá điều chỉnh Không có Không có
Tìm trong phần liên kết thực tế bằng Google Tìm kiếm Không có Không có
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Bản xem trước Imagen 4

Dùng thử trong Google AI Studio

Mô hình tạo hình ảnh mới nhất của chúng tôi, có khả năng hiển thị văn bản tốt hơn đáng kể và chất lượng hình ảnh tổng thể cao hơn.

Các mô hình xem trước có thể thay đổi trước khi trở nên ổn định và có giới hạn tốc độ hạn chế hơn.

Bậc miễn phí Gói trả phí, cho mỗi hình ảnh tính bằng USD
Giá hình ảnh chuẩn của Imagen 4 Không có $0,04
Giá hình ảnh của Imagen 4 Ultra Không có 0,06 USD
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Mô hình tạo hình ảnh tiên tiến của chúng tôi, được cung cấp cho các nhà phát triển trong gói trả phí của Gemini API.

Bậc miễn phí Gói trả phí, cho mỗi hình ảnh tính bằng USD
Giá của hình ảnh Không có 0,03 USD
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Veo 3 (Bản dùng thử)

Dùng thử Veo 3

Mô hình tạo video mới nhất của chúng tôi, được cung cấp cho các nhà phát triển trong cấp trả phí của Gemini API.

Bậc miễn phí Cấp có tính phí, tính theo giây bằng USD
Giá video có âm thanh (mặc định) Không có $0,75
Giá video không có âm thanh Không có 0,5 USD
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Mô hình tạo video tiên tiến của chúng tôi, được cung cấp cho các nhà phát triển trong cấp trả phí của Gemini API.

Bậc miễn phí Cấp có tính phí, tính theo giây bằng USD
Giá của video Không có $0,35
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Gemini Embedding

Dùng thử API

Mô hình nhúng mới nhất của chúng tôi, ổn định hơn và có hạn mức cao hơn so với các phiên bản trước, được cung cấp cho nhà phát triển ở cấp miễn phí và cấp có tính phí của Gemini API.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí 0,15 USD
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Mô hình nguồn mở, tiên tiến và gọn nhẹ của chúng tôi được xây dựng dựa trên cùng một công nghệ hỗ trợ các mô hình Gemini.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí Không có
Giá đầu ra Miễn phí Không có
Giá trong bộ nhớ đệm theo bối cảnh Miễn phí Không có
Lưu vào bộ nhớ đệm theo bối cảnh (bộ nhớ) Miễn phí Không có
Giá điều chỉnh Không có Không có
Tìm trong phần liên kết thực tế bằng Google Tìm kiếm Không có Không có
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Mô hình mở của chúng tôi được xây dựng để mang lại hiệu suất hiệu quả trên các thiết bị hằng ngày như điện thoại di động, máy tính xách tay và máy tính bảng.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí Không có
Giá đầu ra Miễn phí Không có
Giá trong bộ nhớ đệm theo bối cảnh Miễn phí Không có
Lưu vào bộ nhớ đệm theo bối cảnh (bộ nhớ) Miễn phí Không có
Giá điều chỉnh Không có Không có
Tìm trong phần liên kết thực tế bằng Google Tìm kiếm Không có Không có
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Mô hình đa phương thức nhanh nhất của chúng tôi, có hiệu suất vượt trội cho nhiều nhiệm vụ đa dạng, lặp đi lặp lại và cửa sổ ngữ cảnh 1 triệu token.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí 0,075 USD, câu lệnh có số lượng mã thông báo <= 128.000
0,15 USD, câu lệnh có số lượng mã thông báo > 128.000
Giá đầu ra Miễn phí 0,3 USD, câu lệnh có số lượng mã thông báo <= 128.000
0,6 USD, câu lệnh có số lượng mã thông báo > 128.000
Giá trong bộ nhớ đệm theo bối cảnh Miễn phí, tối đa 1 triệu mã thông báo lưu trữ mỗi giờ 0,01875 USD, câu lệnh <= 128.000 mã thông báo
0,0375 USD, câu lệnh > 128.000 mã thông báo
Lưu vào bộ nhớ đệm theo bối cảnh (bộ nhớ) Miễn phí 1 USD mỗi giờ
Giá điều chỉnh Giá mã thông báo cho các mô hình được điều chỉnh là như nhau
Dịch vụ điều chỉnh không mất phí.
Giá mã thông báo cho các mô hình được điều chỉnh là như nhau
Dịch vụ điều chỉnh không mất phí.
Tìm trong phần liên kết thực tế bằng Google Tìm kiếm Không có 35 USD / 1.000 yêu cầu cơ sở
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Mô hình nhỏ nhất của chúng tôi cho các trường hợp sử dụng có trí thông minh thấp hơn, với cửa sổ ngữ cảnh 1 triệu token.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí 0,0375 USD, câu lệnh <= 128.000 mã thông báo
0,075 USD, câu lệnh > 128.000 mã thông báo
Giá đầu ra Miễn phí 0,15 USD, câu lệnh <= 128.000 mã thông báo
0,3 USD, câu lệnh > 128.000 mã thông báo
Giá trong bộ nhớ đệm theo bối cảnh Miễn phí, tối đa 1 triệu mã thông báo lưu trữ mỗi giờ 0,01 USD, câu lệnh <= 128.000 mã thông báo
0,02 USD, câu lệnh > 128.000 mã thông báo
Lưu vào bộ nhớ đệm theo bối cảnh (bộ nhớ) Miễn phí 0,25 USD mỗi giờ
Giá điều chỉnh Giá mã thông báo cho các mô hình được điều chỉnh là như nhau
Dịch vụ điều chỉnh không mất phí.
Giá mã thông báo cho các mô hình được điều chỉnh là như nhau
Dịch vụ điều chỉnh không mất phí.
Tìm trong phần liên kết thực tế bằng Google Tìm kiếm Không có 35 USD / 1.000 yêu cầu cơ sở
Được dùng để cải thiện các sản phẩm của chúng tôi Không

Mô hình Gemini 1.5 Series có trí thông minh cao nhất của chúng tôi, với cửa sổ ngữ cảnh đột phá 2 triệu token.

Bậc miễn phí Bậc có tính phí, cho mỗi 1 triệu mã thông báo tính bằng USD
Nhập giá Miễn phí 1,25 USD, câu lệnh <= 128.000 mã thông báo
2,5 USD, câu lệnh > 128.000 mã thông báo
Giá đầu ra Miễn phí 5 USD, câu lệnh <= 128.000 mã thông báo
10 USD, câu lệnh > 128.000 mã thông báo
Giá trong bộ nhớ đệm theo bối cảnh Không có 0,3125 USD, câu lệnh <= 128.000 mã thông báo
0,625 USD, câu lệnh > 128.000 mã thông báo
Lưu vào bộ nhớ đệm theo bối cảnh (bộ nhớ) Không có 4,5 USD mỗi giờ
Giá điều chỉnh Không có Không có
Tìm trong phần liên kết thực tế bằng Google Tìm kiếm Không có 35 USD / 1.000 yêu cầu cơ sở
Được dùng để cải thiện các sản phẩm của chúng tôi Không

[*] Bạn có thể sử dụng Google AI Studio miễn phí ở tất cả các khu vực được hỗ trợ. Hãy xem phần Câu hỏi thường gặp về việc thanh toán để biết thêm thông tin.

[**] Giá có thể khác với giá niêm yết ở đây và giá được cung cấp trên Vertex AI. Để biết giá của Vertex, hãy xem trang thông tin về giá của Vertex AI.

[***] Nếu bạn đang sử dụng tính năng truy xuất động để tối ưu hoá chi phí, thì chỉ những yêu cầu có ít nhất một URL hỗ trợ cơ sở từ web trong phản hồi mới bị tính phí cho tính năng Đặt cơ sở với Google Tìm kiếm. Luôn áp dụng chi phí cho Gemini. Hạn mức tốc độ có thể thay đổi.