Ghi chú phát hành

Trang này ghi lại nội dung cập nhật của Gemini API.

Ngày 22 tháng 7 năm 2025

  • Phát hành gemini-2.5-flash-lite, mô hình Gemini 2.5 có hiệu suất cao, chi phí thấp và tốc độ nhanh. Để tìm hiểu thêm, hãy xem Gemini 2.5 Flash-Lite.

Ngày 17 tháng 7 năm 2025

  • Ra mắt veo-3.0-generate-preview, bản cập nhật mới nhất cho Veo, bổ sung tính năng tạo video có âm thanh. Để tìm hiểu thêm về Veo 3, hãy truy cập vào trang Các mô hình.

  • Tăng hạn mức về tốc độ cho Imagen 4 Standard và Ultra. Hãy truy cập vào trang Hạn mức tốc độ để biết thêm thông tin chi tiết.

Ngày 14 tháng 7 năm 2025

  • Phát hành gemini-embedding-001, phiên bản ổn định của mô hình nhúng văn bản. Để tìm hiểu thêm, hãy xem bài viết về các vectơ nhúng. gemini-embedding-exp-03-07 Mô hình này sẽ ngừng hoạt động từ ngày 14 tháng 8 năm 2025.

Ngày 7 tháng 7 năm 2025

  • Ra mắt Chế độ xử lý theo lô của Gemini API. Gộp các yêu cầu và gửi chúng để xử lý không đồng bộ. Để tìm hiểu thêm, hãy xem phần Chế độ hàng loạt.

Ngày 26 tháng 6 năm 2025

  • Các mô hình xem trước gemini-2.5-pro-preview-05-06gemini-2.5-pro-preview-03-25 hiện đang chuyển hướng đến phiên bản ổn định mới nhất gemini-2.5-pro.

  • Ngừng sử dụng gemini-2.5-pro-exp-03-25.

Ngày 24 tháng 6 năm 2025

  • Phát hành các mô hình Xem trước tiêu chuẩn và Ultra của Imagen 4. Để tìm hiểu thêm, hãy xem trang Tạo hình ảnh.

Ngày 17 tháng 6 năm 2025

  • Phát hành gemini-2.5-pro, phiên bản ổn định của mô hình mạnh mẽ nhất của chúng tôi, hiện có khả năng tư duy thích ứng. Để tìm hiểu thêm, hãy xem Gemini 2.5 ProTư duy. gemini-2.5-pro-preview-05-06 sẽ được chuyển hướng đến gemini-2.5-pro vào ngày 26 tháng 6 năm 2025.
  • Phát hành gemini-2.5-flash, mô hình 2.5 Flash ổn định đầu tiên của chúng tôi. Để tìm hiểu thêm, hãy xem Gemini 2.5 Flash. gemini-2.5-flash-preview-04-17 sẽ ngừng hoạt động kể từ ngày 15 tháng 7 năm 2025.
  • Phát hành gemini-2.5-flash-lite-preview-06-17, một mô hình Gemini 2.5 có hiệu suất cao và chi phí thấp. Để tìm hiểu thêm, hãy xem phần Bản xem trước Gemini 2.5 Flash-Lite.

Ngày 5 tháng 6 năm 2025

  • Phát hành gemini-2.5-pro-preview-06-05, một phiên bản mới của mô hình mạnh mẽ nhất của chúng tôi, hiện có khả năng tư duy thích ứng. Để tìm hiểu thêm, hãy xem phần Bản dùng thử Gemini 2.5 ProTư duy. gemini-2.5-pro-preview-05-06 sẽ được chuyển hướng đến gemini-2.5-pro vào ngày 26 tháng 6 năm 2025.

Ngày 20 tháng 5 năm 2025

Các bản cập nhật API:

Nội dung cập nhật về mô hình:

Ngày 7 tháng 5 năm 2025

Ngày 6 tháng 5 năm 2025

  • Phát hành gemini-2.5-pro-preview-05-06, một phiên bản mới của mô hình mạnh mẽ nhất của chúng tôi, với những điểm cải tiến về mã và lệnh gọi hàm. gemini-2.5-pro-preview-03-25 sẽ tự động trỏ đến phiên bản mới của mô hình.

Ngày 17 tháng 4 năm 2025

Ngày 16 tháng 4 năm 2025

  • Ra mắt tính năng lưu vào bộ nhớ đệm bối cảnh cho Gemini 2.0 Flash.

Ngày 9 tháng 4 năm 2025

Nội dung cập nhật về mô hình:

  • Phát hành veo-2.0-generate-001, một mô hình chuyển văn bản và hình ảnh sang video được cung cấp rộng rãi (GA), có khả năng tạo ra những video chi tiết và có sắc thái nghệ thuật. Để tìm hiểu thêm, hãy xem tài liệu về Veo.
  • Phát hành gemini-2.0-flash-live-001, một phiên bản xem trước công khai của mô hình Live API có bật tính năng thanh toán.

    • Quản lý phiên và độ tin cậy nâng cao

      • Tiếp tục phiên: Duy trì phiên hoạt động trong thời gian mạng bị gián đoạn tạm thời. API này hiện hỗ trợ tính năng lưu trữ trạng thái phiên ở phía máy chủ (tối đa 24 giờ) và cung cấp các hàm (session_resumption) để kết nối lại và tiếp tục từ nơi bạn đã dừng.
      • Các phiên dài hơn thông qua tính năng nén ngữ cảnh: Cho phép các lượt tương tác kéo dài hơn giới hạn thời gian trước đó. Định cấu hình tính năng nén cửa sổ ngữ cảnh bằng cơ chế cửa sổ trượt để tự động quản lý độ dài ngữ cảnh, ngăn chặn việc kết thúc đột ngột do giới hạn ngữ cảnh.
      • Thông báo ngắt kết nối một cách êm ái: Nhận thông báo từ máy chủ GoAway cho biết thời điểm một kết nối sắp đóng, cho phép xử lý một cách êm ái trước khi kết thúc.
    • Kiểm soát nhiều hơn đối với động lực tương tác

    • Tính năng phát hiện hoạt động thoại (VAD) có thể định cấu hình: Chọn mức độ nhạy hoặc tắt hoàn toàn tính năng VAD tự động và sử dụng các sự kiện mới của ứng dụng (activityStart, activityEnd) để kiểm soát lượt thoại theo cách thủ công.

    • Xử lý gián đoạn có thể định cấu hình: Quyết định xem hoạt động đầu vào của người dùng có nên làm gián đoạn phản hồi của mô hình hay không.

    • Phạm vi phủ sóng có thể định cấu hình: Chọn xem API xử lý liên tục tất cả dữ liệu đầu vào âm thanh và video hay chỉ ghi lại dữ liệu đầu vào khi phát hiện thấy người dùng cuối đang nói.

    • Độ phân giải nội dung nghe nhìn có thể định cấu hình: Tối ưu hoá chất lượng hoặc mức sử dụng mã thông báo bằng cách chọn độ phân giải cho nội dung nghe nhìn đầu vào.

    • Đầu ra và tính năng phong phú hơn

    • Nhiều lựa chọn về giọng nói và ngôn ngữ: Chọn trong số 2 giọng nói mới và 30 ngôn ngữ mới cho đầu ra âm thanh. Giờ đây, bạn có thể định cấu hình ngôn ngữ đầu ra trong speechConfig.

    • Truyền trực tuyến văn bản: Nhận phản hồi bằng văn bản theo từng phần khi phản hồi được tạo, giúp người dùng xem nhanh hơn.

    • Báo cáo mức sử dụng mã thông báo: Nắm được thông tin chi tiết về mức sử dụng thông qua số lượng mã thông báo chi tiết được cung cấp trong trường usageMetadata của thông báo máy chủ, được phân tích theo phương thức và giai đoạn của câu lệnh hoặc câu trả lời.

Ngày4 tháng 4 năm 2025

  • Phát hành gemini-2.5-pro-preview-03-25, phiên bản Gemini 2.5 Pro dùng thử công khai có bật tính năng thanh toán. Bạn có thể tiếp tục sử dụng gemini-2.5-pro-exp-03-25 ở cấp miễn phí.

Ngày 25 tháng 3 năm 2025

  • Phát hành gemini-2.5-pro-exp-03-25, một mô hình Gemini thử nghiệm công khai. Theo mặc định, mô hình này luôn ở chế độ suy nghĩ. Để tìm hiểu thêm, hãy xem phần Gemini 2.5 Pro (thử nghiệm).

Ngày 12 tháng 3 năm 2025

Nội dung cập nhật về mô hình:

  • Ra mắt mô hình thử nghiệm Gemini 2.0 Flash có khả năng tạo và chỉnh sửa hình ảnh.
  • Được phát hành gemma-3-27b-it, có trên AI Studio và thông qua Gemini API, trong khuôn khổ việc ra mắt Gemma 3.

Các bản cập nhật API:

  • Thêm tính năng hỗ trợ cho URL của YouTube làm nguồn nội dung nghe nhìn.
  • Đã thêm tính năng hỗ trợ để đưa video nội tuyến có kích thước dưới 20 MB vào.

Ngày 11 tháng 3 năm 2025

Nội dung cập nhật đối với SDK:

Ngày 7 tháng 3 năm 2025

Nội dung cập nhật về mô hình:

  • Phát hành gemini-embedding-exp-03-07, một mô hình nhúng thử nghiệm dựa trên Gemini trong bản dùng thử công khai.

Ngày 28 tháng 2 năm 2025

Các bản cập nhật API:

Ngày 25 tháng 2 năm 2025

Nội dung cập nhật về mô hình:

  • Phát hành gemini-2.0-flash-lite, phiên bản được cung cấp công khai (GA) của Gemini 2.0 Flash-Lite, được tối ưu hoá về tốc độ, quy mô và hiệu quả chi phí.

Ngày 19 tháng 2 năm 2025

Tin cập nhật về AI Studio:

Các bản cập nhật API:

Ngày 18 tháng 2 năm 2025

Nội dung cập nhật về mô hình:

  • Gemini 1.0 Pro không còn được hỗ trợ nữa. Để biết danh sách các mô hình được hỗ trợ, hãy xem phần Các mô hình Gemini.

Ngày 11 tháng 2 năm 2025

Các bản cập nhật API:

Ngày 6 tháng 2 năm 2025

Nội dung cập nhật về mô hình:

Nội dung cập nhật đối với SDK:

Ngày 5 tháng 2 năm 2025

Nội dung cập nhật về mô hình:

  • Phát hành gemini-2.0-flash-001, một phiên bản được cung cấp rộng rãi (GA) của Gemini 2.0 Flash hỗ trợ đầu ra chỉ có văn bản.
  • Phát hành gemini-2.0-pro-exp-02-05, một phiên bản thử nghiệm xem trước công khai của Gemini 2.0 Pro.
  • Phát hành gemini-2.0-flash-lite-preview-02-05, một mô hình thử nghiệm xem trước công khai được tối ưu hoá để mang lại hiệu quả chi phí.

Các bản cập nhật API:

Nội dung cập nhật đối với SDK:

Ngày 21 tháng 1 năm 2025

Nội dung cập nhật về mô hình:

Ngày 19 tháng 12 năm 2024

Nội dung cập nhật về mô hình:

  • Phát hành Chế độ tư duy 2.0 Flash của Gemini để dùng thử công khai. Chế độ suy nghĩ là một mô hình tính toán trong thời gian thử nghiệm, cho phép bạn xem quy trình suy nghĩ của mô hình trong khi mô hình tạo câu trả lời và tạo ra câu trả lời có khả năng suy luận mạnh mẽ hơn.

    Đọc thêm về Chế độ tư duy của Gemini 2.0 Flash trên trang tổng quan của chúng tôi.

Ngày 11 tháng 12 năm 2024

Nội dung cập nhật về mô hình:

  • Phát hành Gemini 2.0 Flash Experimental để dùng thử công khai. Danh sách một phần các tính năng của Gemini 2.0 Flash Experimental bao gồm:
    • Nhanh gấp đôi so với Gemini 1.5 Pro
    • Phát trực tiếp hai chiều bằng Live API
    • Tạo câu trả lời đa phương thức dưới dạng văn bản, hình ảnh và lời nói
    • Sử dụng công cụ tích hợp với khả năng suy luận nhiều lượt để dùng các tính năng như thực thi mã, Tìm kiếm, gọi hàm, v.v.

Đọc thêm về Gemini 2.0 Flash trên trang tổng quan của chúng tôi.

Ngày 21 tháng 11 năm 2024

Nội dung cập nhật về mô hình:

  • Phát hành gemini-exp-1121, một mô hình Gemini API thử nghiệm mạnh mẽ hơn nữa.

Nội dung cập nhật về mô hình:

  • Cập nhật các bí danh mô hình gemini-1.5-flash-latestgemini-1.5-flash để sử dụng gemini-1.5-flash-002.
    • Thay đổi thành tham số top_k: Mô hình gemini-1.5-flash-002 hỗ trợ các giá trị top_k từ 1 đến 41 (không bao gồm). Các giá trị lớn hơn 40 sẽ được thay đổi thành 40.

Ngày 14 tháng 11 năm 2024

Nội dung cập nhật về mô hình:

  • Phát hành gemini-exp-1114, một mô hình Gemini API thử nghiệm mạnh mẽ.

Ngày 8 tháng 11 năm 2024

Các bản cập nhật API:

Ngày 31 tháng 10 năm 2024

Các bản cập nhật API:

Ngày 3 tháng 10 năm 2024

Nội dung cập nhật về mô hình:

  • Phát hành gemini-1.5-flash-8b-001, một phiên bản ổn định của mô hình API Gemini nhỏ nhất của chúng tôi.

Ngày 24 tháng 9 năm 2024

Nội dung cập nhật về mô hình:

  • Phát hành gemini-1.5-pro-002gemini-1.5-flash-002, hai phiên bản ổn định mới của Gemini 1.5 Pro và 1.5 Flash, để cung cấp rộng rãi.
  • Cập nhật mã mô hình gemini-1.5-pro-latest để sử dụng gemini-1.5-pro-002 và mã mô hình gemini-1.5-flash-latest để sử dụng gemini-1.5-flash-002.
  • Phát hành gemini-1.5-flash-8b-exp-0924 để thay thế gemini-1.5-flash-8b-exp-0827.
  • Phát hành bộ lọc an toàn về tính liêm chính công dân cho Gemini API và AI Studio.
  • Phát hành tính năng hỗ trợ 2 tham số mới cho Gemini 1.5 Pro và 1.5 Flash trong Python và NodeJS: frequencyPenaltypresencePenalty.

Ngày 19 tháng 9 năm 2024

Tin cập nhật về AI Studio:

  • Thêm nút thích và không thích vào các câu trả lời của mô hình để người dùng có thể đưa ra ý kiến phản hồi về chất lượng của câu trả lời.

Các bản cập nhật API:

  • Thêm hỗ trợ cho các khoản tín dụng Google Cloud. Giờ đây, bạn có thể sử dụng các khoản tín dụng này cho việc sử dụng Gemini API.

Ngày 17 tháng 9 năm 2024

Tin cập nhật về AI Studio:

  • Thêm nút Mở trong Colab để xuất một câu lệnh và mã để chạy câu lệnh đó sang một sổ tay Colab. Tính năng này hiện chưa hỗ trợ việc đưa ra lời nhắc bằng các công cụ (chế độ JSON, gọi hàm hoặc thực thi mã).

Ngày 13 tháng 9 năm 2024

Tin cập nhật về AI Studio:

  • Thêm chế độ so sánh để bạn có thể so sánh các câu trả lời của nhiều mô hình và câu lệnh để tìm ra câu trả lời phù hợp nhất cho trường hợp sử dụng của bạn.

Ngày 30 tháng 8 năm 2024

Nội dung cập nhật về mô hình:

Ngày 27 tháng 8 năm 2024

Nội dung cập nhật về mô hình:

  • Phát hành các mô hình thử nghiệm sau đây:
    • gemini-1.5-pro-exp-0827
    • gemini-1.5-flash-exp-0827
    • gemini-1.5-flash-8b-exp-0827

Ngày 9 tháng 8 năm 2024

Các bản cập nhật API:

Ngày 5 tháng 8 năm 2024

Nội dung cập nhật về mô hình:

  • Đã phát hành tính năng tinh chỉnh cho Gemini 1.5 Flash.

Ngày 1 tháng 8 năm 2024

Nội dung cập nhật về mô hình:

  • Phát hành gemini-1.5-pro-exp-0801, một phiên bản thử nghiệm mới của Gemini 1.5 Pro.

Ngày 12 tháng 7 năm 2024

Nội dung cập nhật về mô hình:

  • Xoá tính năng hỗ trợ Gemini 1.0 Pro Vision khỏi các dịch vụ và công cụ AI của Google.

Ngày 27 tháng 6 năm 2024

Nội dung cập nhật về mô hình:

  • Bản phát hành rộng rãi cho cửa sổ ngữ cảnh 2 triệu token của Gemini 1.5 Pro.

Các bản cập nhật API:

Ngày 18 tháng 6 năm 2024

Các bản cập nhật API:

Ngày 12 tháng 6 năm 2024

Nội dung cập nhật về mô hình:

  • Gemini 1.0 Pro Vision không còn được dùng nữa.

Ngày 23 tháng 5 năm 2024

Nội dung cập nhật về mô hình:

  • Gemini 1.5 Pro (gemini-1.5-pro-001) hiện đã được cung cấp rộng rãi (GA).
  • Gemini 1.5 Flash (gemini-1.5-flash-001) hiện đã được phát hành rộng rãi (GA).

Ngày 14 tháng 5 năm 2024

Các bản cập nhật API:

  • Ra mắt cửa sổ ngữ cảnh 2 triệu token cho Gemini 1.5 Pro (danh sách chờ).
  • Ra mắt mô hình thanh toán trả tiền theo mức dùng cho Gemini 1.0 Pro, trong đó mô hình thanh toán cho Gemini 1.5 Pro và Gemini 1.5 Flash sẽ ra mắt trong thời gian tới.
  • Giới thiệu hạn mức tốc độ cao hơn cho cấp trả phí sắp ra mắt của Gemini 1.5 Pro.
  • Thêm tính năng hỗ trợ video tích hợp vào File API.
  • Thêm tính năng hỗ trợ văn bản thuần tuý vào File API.
  • Thêm tính năng hỗ trợ gọi hàm song song, trả về nhiều lệnh gọi cùng một lúc.

Ngày 10 tháng 5 năm 2024

Nội dung cập nhật về mô hình:

  • Phát hành Gemini 1.5 Flash (gemini-1.5-flash-latest) ở chế độ xem trước.

Ngày 9 tháng 4 năm 2024

Nội dung cập nhật về mô hình:

  • Phát hành Gemini 1.5 Pro (gemini-1.5-pro-latest) ở chế độ xem trước.
  • Phát hành một mô hình nhúng văn bản mới, text-embeddings-004, hỗ trợ các kích thước nhúng linh hoạt dưới 768.

Các bản cập nhật API:

  • Phát hành File API để tạm thời lưu trữ các tệp đa phương tiện để dùng trong quá trình tạo câu lệnh.
  • Thêm tính năng hỗ trợ câu lệnh bằng dữ liệu văn bản, hình ảnh và âm thanh, còn được gọi là câu lệnh đa phương thức. Để tìm hiểu thêm, hãy xem bài viết Đưa ra câu lệnh bằng nội dung nghe nhìn.
  • Phát hành Hướng dẫn hệ thống ở giai đoạn thử nghiệm beta.
  • Thêm Chế độ gọi hàm, xác định hành vi thực thi cho việc gọi hàm.
  • Đã thêm chế độ hỗ trợ cho lựa chọn cấu hình response_mime_type, cho phép bạn yêu cầu phản hồi ở định dạng JSON.

Ngày 19 tháng 3 năm 2024

Nội dung cập nhật về mô hình:

Ngày 13 tháng 12 năm 2023

Nội dung cập nhật về mô hình:

  • gemini-pro: Mô hình văn bản mới cho nhiều loại nhiệm vụ. Cân bằng khả năng và hiệu quả.
  • gemini-pro-vision: Mô hình đa phương thức mới cho nhiều loại nhiệm vụ. Cân bằng giữa khả năng và hiệu quả.
  • embedding-001: Mô hình nhúng mới.
  • aqa: Một mô hình mới được điều chỉnh đặc biệt để trả lời các câu hỏi bằng cách sử dụng các đoạn văn bản để làm cơ sở cho câu trả lời được tạo.

Hãy xem bài viết Các mô hình Gemini để biết thêm thông tin.

Các bản cập nhật phiên bản API:

  • v1: Kênh API ổn định.
  • v1beta: Kênh thử nghiệm Beta. Kênh này có các tính năng có thể đang trong giai đoạn phát triển.

Hãy xem chủ đề về các phiên bản API để biết thêm thông tin chi tiết.

Các bản cập nhật API:

  • GenerateContent là một điểm cuối hợp nhất duy nhất cho cuộc trò chuyện và tin nhắn văn bản.
  • Phát trực tuyến bằng phương thức StreamGenerateContent.
  • Chức năng đa phương thức: Hình ảnh là một phương thức mới được hỗ trợ
  • Các tính năng thử nghiệm mới:
  • Số lượng đề xuất được cập nhật: Các mô hình Gemini chỉ trả về 1 đề xuất.
  • Các danh mục Chế độ cài đặt về an toàn và SafetyRating khác nhau. Hãy xem chế độ cài đặt an toàn để biết thêm thông tin chi tiết.
  • Các mô hình Gemini hiện chưa hỗ trợ tính năng điều chỉnh mô hình (Đang tiến hành).