Les embeddings sont une représentation numérique des entrées de texte qui ouvrent la voie à un certain nombre de cas d'utilisation uniques, tels que le clustering, la mesure de similarité et la récupération d'informations. Pour obtenir une présentation, consultez le guide sur les embeddings.
Contrairement aux modèles d'IA générative qui créent de nouveaux contenus, le modèle Gemini Embedding est uniquement destiné à transformer le format de vos données d'entrée en représentation numérique. Bien que Google soit responsable de la fourniture d'un modèle d'embedding qui transforme le format de vos données d'entrée au format numérique demandé, les utilisateurs conservent l'entière responsabilité des données qu'ils saisissent et des embeddings qui en résultent. En utilisant le modèle Gemini Embedding, vous confirmez que vous disposez des droits nécessaires sur tous les contenus que vous mettez en ligne. Ne générez aucun contenu qui porte atteinte à la propriété intellectuelle ou aux droits au respect de la confidentialité d'autrui. Votre utilisation de ce service est soumise à notre Règlement sur les utilisations interdites et aux Conditions d'utilisation de Google.
Méthode : models.embedContent
- Point de terminaison
- Paramètres de chemin d'accès
- Corps de la requête
- Corps de la réponse
- Champs d'application des autorisations
- Exemple de requête
Génère un vecteur d'embedding de texte à partir de l'Content
d'entrée à l'aide du modèle d'embedding Gemini spécifié.
Point de terminaison
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:embedContent
Paramètres de chemin d'accès
model
string
Obligatoire. Nom de ressource du modèle. Il sert d'ID pour le modèle.
Ce nom doit correspondre à un nom de modèle renvoyé par la méthode models.list
.
Format : models/{model}
. Il se présente sous la forme models/{model}
.
Corps de la requête
Le corps de la requête contient des données présentant la structure suivante :
content
object (Content
)
Obligatoire. Contenu à intégrer. Seuls les champs parts.text
seront comptabilisés.
taskType
enum (TaskType
)
Facultatif. Type de tâche facultatif pour lequel les embeddings seront utilisés. Non compatible avec les modèles antérieurs (models/embedding-001
).
title
string
Facultatif. Titre facultatif du texte. Ne s'applique que lorsque TaskType est défini sur RETRIEVAL_DOCUMENT
.
Remarque : Spécifier un title
pour RETRIEVAL_DOCUMENT
permet d'obtenir des embeddings de meilleure qualité pour la récupération.
outputDimensionality
integer
Facultatif. Dimension réduite facultative pour l'embedding de sortie. Si cette option est définie, les valeurs excessives de l'embedding de sortie sont tronquées à la fin. Compatible avec les modèles récents (à partir de 2024) uniquement. Vous ne pouvez pas définir cette valeur si vous utilisez l'ancien modèle (models/embedding-001
).
Exemple de requête
Python
Node.js
Go
Coquille Rose
Corps de la réponse
Réponse à un EmbedContentRequest
.
Si la requête aboutit, le corps de la réponse contient des données qui ont la structure suivante :
embedding
object (ContentEmbedding
)
Uniquement en sortie. Représentation vectorielle continue générée à partir du contenu d'entrée.
Représentation JSON |
---|
{
"embedding": {
object ( |
Méthode : models.batchEmbedContents
- Point de terminaison
- Paramètres de chemin d'accès
- Corps de la requête
- Corps de la réponse
- Champs d'application des autorisations
- Exemple de requête
- EmbedContentRequest
Génère plusieurs vecteurs d'embedding à partir de l'entrée Content
, qui se compose d'un lot de chaînes représentées sous forme d'objets EmbedContentRequest
.
Point de terminaison
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:batchEmbedContents
Paramètres de chemin d'accès
model
string
Obligatoire. Nom de ressource du modèle. Il sert d'ID pour le modèle.
Ce nom doit correspondre à un nom de modèle renvoyé par la méthode models.list
.
Format : models/{model}
. Il se présente sous la forme models/{model}
.
Corps de la requête
Le corps de la requête contient des données présentant la structure suivante :
requests[]
object (EmbedContentRequest
)
Obligatoire. Requêtes d'intégration pour le lot. Le modèle de chacune de ces requêtes doit correspondre au modèle spécifié BatchEmbedContentsRequest.model
.
Exemple de requête
Python
Node.js
Go
Coquille Rose
Corps de la réponse
Réponse à une BatchEmbedContentsRequest
.
Si la requête aboutit, le corps de la réponse contient des données qui ont la structure suivante :
embeddings[]
object (ContentEmbedding
)
Uniquement en sortie. Les embeddings pour chaque requête, dans le même ordre que ceux fournis dans la requête par lot.
Représentation JSON |
---|
{
"embeddings": [
{
object ( |
EmbedContentRequest
Requête contenant le Content
à intégrer au modèle.
model
string
Obligatoire. Nom de ressource du modèle. Il sert d'ID pour le modèle.
Ce nom doit correspondre à un nom de modèle renvoyé par la méthode models.list
.
Format : models/{model}
content
object (Content
)
Obligatoire. Contenu à intégrer. Seuls les champs parts.text
seront comptabilisés.
taskType
enum (TaskType
)
Facultatif. Type de tâche facultatif pour lequel les embeddings seront utilisés. Non compatible avec les modèles antérieurs (models/embedding-001
).
title
string
Facultatif. Titre facultatif du texte. Ne s'applique que lorsque TaskType est défini sur RETRIEVAL_DOCUMENT
.
Remarque : Spécifier un title
pour RETRIEVAL_DOCUMENT
permet d'obtenir des embeddings de meilleure qualité pour la récupération.
outputDimensionality
integer
Facultatif. Dimension réduite facultative pour l'embedding de sortie. Si cette option est définie, les valeurs excessives de l'embedding de sortie sont tronquées à la fin. Compatible avec les modèles récents (à partir de 2024) uniquement. Vous ne pouvez pas définir cette valeur si vous utilisez l'ancien modèle (models/embedding-001
).
ContentEmbedding
Une liste de valeurs flottantes représentant un embedding.
values[]
number
Valeurs d'embedding.
Représentation JSON |
---|
{ "values": [ number ] } |
TaskType
Type de tâche pour laquelle l'embedding sera utilisé.
Enums | |
---|---|
TASK_TYPE_UNSPECIFIED |
Valeur non définie, qui sera définie par défaut sur l'une des autres valeurs enum. |
RETRIEVAL_QUERY |
Spécifie que le texte donné est une requête dans un contexte de recherche/récupération. |
RETRIEVAL_DOCUMENT |
Spécifie que le texte donné est un document du corpus dans lequel la recherche est effectuée. |
SEMANTIC_SIMILARITY |
Indique que le texte donné sera utilisé pour la STS. |
CLASSIFICATION |
Spécifie que le texte donné sera classifié. |
CLUSTERING |
Spécifie que les embeddings seront utilisés pour le clustering. |
QUESTION_ANSWERING |
Indique que le texte donné sera utilisé pour répondre aux questions. |
FACT_VERIFICATION |
Indique que le texte donné sera utilisé pour la vérification de faits. |
CODE_RETRIEVAL_QUERY |
Indique que le texte donné sera utilisé pour la récupération de code. |