產生文字嵌入

google_ml_integration 擴充功能會在兩個不同的命名空間中嵌入函式:publicgoogle_ml。本頁說明如何使用這些命名空間中的函式生成文字嵌入。

public 架構中的 embedding() 函式可搭配任何 Vertex AI 嵌入模型使用,無須註冊端點。如要傳遞任何自訂資訊 (例如工作類型),請註冊端點,然後在 google_ml 結構定義中使用 google_ml.embedding() 函式。如要進一步瞭解如何註冊端點,請參閱「註冊模型」。

嵌入的運作方式

假設在 AlloyDB 上執行的資料庫具有下列特性:

  • 資料庫包含資料表 items。這份表格的每一列都說明貴商家銷售的項目。

  • items 資料表包含 complaints 資料欄。這個 TEXT 欄會儲存買家對各個項目的申訴記錄。

  • 資料庫會與 Vertex AI Model Garden 整合,因此可存取gemini-embedding-001英文模型。

雖然這個資料庫會儲存有關商品的申訴內容,但這些內容是以純文字形式儲存,因此難以查詢。舉例來說,如要查看收到錯誤顏色商品的顧客最常抱怨哪些項目,您可以在資料表上執行一般 SQL 查詢,尋找各種關鍵字相符項目。不過,這種做法只會比對包含這些完全相符關鍵字的資料列。

舉例來說,SELECT * FROM item WHERE complaints LIKE "%wrong color%" 等基本 SQL 查詢不會傳回 complaints 欄位只包含 The picture shows a blue one, but the one I received was red 的資料列。

使用 LLM 輔助嵌入的 SQL 查詢,有助於針對這類查詢傳回語意相似的回覆。套用嵌入後,您可以在這個範例中查詢資料表,找出與指定文字提示 (例如 It was the wrong color) 語意相似的項目。

如要產生嵌入,請選取下列其中一個結構定義。

後續步驟