Gemini API में फ़ाइन ट्यूनिंग की सुविधा उपलब्ध है. इसकी मदद से, इनपुट/आउटपुट के उदाहरणों का छोटा डेटासेट होने पर भी, आउटपुट को बेहतर बनाया जा सकता है. ज़्यादा जानकारी के लिए, मॉडल ट्यूनिंग गाइड और ट्यूटोरियल देखें.
तरीका: tunedModels.create
- एंडपॉइंट
- क्वेरी पैरामीटर
- अनुरोध का मुख्य हिस्सा
- जवाब का मुख्य हिस्सा
- अनुमति पाने के लिंक
- अनुरोध का उदाहरण
इस फ़ंक्शन का इस्तेमाल करके, ट्यून किया गया मॉडल बनाया जाता है. google.longrunning.Operations
सेवा के ज़रिए, इंटरमीडिएट ट्यूनिंग की प्रोग्रेस देखें.
Operations सेवा के ज़रिए, स्टेटस और नतीजों को ऐक्सेस करें. उदाहरण: GET /v1/tunedModels/az2mb0bpw6i/operations/000-111-222
एंडपॉइंट
posthttps: / /generativelanguage.googleapis.com /v1beta /tunedModels
क्वेरी पैरामीटर
tunedModelId
string
ज़रूरी नहीं. अगर ट्यून किए गए मॉडल के लिए यूनीक आईडी दिया गया है, तो यह उसका यूनीक आईडी होता है. इस वैल्यू में ज़्यादा से ज़्यादा 40 वर्ण होने चाहिए. पहला वर्ण कोई अक्षर होना चाहिए और आखिरी वर्ण कोई अक्षर या संख्या हो सकती है. आईडी, इस रेगुलर एक्सप्रेशन से मेल खाना चाहिए: [a-z]([a-z0-9-]{0,38}[a-z0-9])?
.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में TunedModel
का उदाहरण है.
displayName
string
ज़रूरी नहीं. उपयोगकर्ता इंटरफ़ेस में इस मॉडल के लिए दिखने वाला नाम. डिसप्ले नेम में स्पेस के साथ-साथ 40 वर्ण होने चाहिए.
description
string
ज़रूरी नहीं. इस मॉडल के बारे में कम शब्दों में जानकारी.
tuningTask
object (TuningTask
)
ज़रूरी है. ट्यूनिंग टास्क, जिससे ट्यून किया गया मॉडल बनता है.
readerProjectNumbers[]
string (int64 format)
ज़रूरी नहीं. उन प्रोजेक्ट नंबर की सूची जिनके पास ट्यून किए गए मॉडल को पढ़ने का ऐक्सेस है.
source_model
Union type
source_model
इनमें से सिर्फ़ एक हो सकता है:tunedModelSource
object (TunedModelSource
)
ज़रूरी नहीं. TunedModel, जिसका इस्तेमाल नए मॉडल को ट्रेन करने के लिए शुरुआती पॉइंट के तौर पर किया जाएगा.
baseModel
string
इम्यूटेबल. ट्यून करने के लिए Model
का नाम. उदाहरण: models/gemini-1.5-flash-001
temperature
number
ज़रूरी नहीं. इससे आउटपुट में रैंडमनेस को कंट्रोल किया जाता है.
वैल्यू [0.0,1.0]
तक हो सकती हैं. 1.0
के आस-पास की वैल्यू से, अलग-अलग तरह के जवाब मिलेंगे. वहीं, 0.0
के आस-पास की वैल्यू से, मॉडल से आम तौर पर कम चौंकाने वाले जवाब मिलेंगे.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के लिए डिफ़ॉल्ट वैल्यू तय करती है.
topP
number
ज़रूरी नहीं. न्यूक्लियस सैंपलिंग के लिए.
न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को चुना जाता है. इस सेट में शामिल टोकन की संभावनाओं का योग कम से कम topP
होता है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के लिए डिफ़ॉल्ट वैल्यू तय करती है.
topK
integer
ज़रूरी नहीं. टॉप-k सैंपलिंग के लिए.
टॉप-k सैंपलिंग में, topK
सबसे ज़्यादा संभावित टोकन के सेट को ध्यान में रखा जाता है. यह वैल्यू, मॉडल को कॉल करते समय बैकएंड के लिए इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के लिए डिफ़ॉल्ट वैल्यू तय करती है.
अनुरोध का उदाहरण
Python
जवाब का मुख्य भाग
अगर एपीआई सही से जुड़ जाता है, तो जवाब के मुख्य हिस्से में Operation
का नया इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.generateContent
यह फ़ंक्शन, इनपुट GenerateContentRequest
के आधार पर मॉडल का जवाब जनरेट करता है. इस्तेमाल से जुड़ी ज़्यादा जानकारी के लिए, टेक्स्ट जनरेट करने से जुड़ी गाइड देखें. ट्यून किए गए मॉडल के साथ-साथ अन्य मॉडल के लिए, इनपुट देने की सुविधाएं अलग-अलग होती हैं. ज़्यादा जानकारी के लिए, मॉडल गाइड और ट्यूनिंग गाइड देखें.
एंडपॉइंट
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=tunedModels /*}:generateContent
पाथ पैरामीटर
model
string
ज़रूरी है. Model
का नाम, जिसका इस्तेमाल जवाब जनरेट करने के लिए किया जाना है.
फ़ॉर्मैट: models/{model}
. यह tunedModels/{tunedmodel}
के फ़ॉर्म में होता है.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में, इस स्ट्रक्चर का डेटा शामिल होता है:
tools[]
object (Tool
)
ज़रूरी नहीं. Tools
की एक सूची, जिसका इस्तेमाल Model
अगले जवाब को जनरेट करने के लिए कर सकता है.
Tool
एक कोड होता है. यह सिस्टम को बाहरी सिस्टम के साथ इंटरैक्ट करने की अनुमति देता है, ताकि Model
की जानकारी और दायरे से बाहर कोई कार्रवाई या कार्रवाइयों का सेट किया जा सके. Function
और codeExecution
Tool
के साथ काम करते हैं. ज़्यादा जानने के लिए, फ़ंक्शन कॉलिंग और कोड एक्ज़ीक्यूशन गाइड देखें.
toolConfig
object (ToolConfig
)
ज़रूरी नहीं. अनुरोध में बताए गए किसी भी Tool
के लिए टूल कॉन्फ़िगरेशन. इस्तेमाल का उदाहरण देखने के लिए, फ़ंक्शन कॉलिंग गाइड देखें.
safetySettings[]
object (SafetySetting
)
ज़रूरी नहीं. असुरक्षित कॉन्टेंट को ब्लॉक करने के लिए, यूनीक SafetySetting
इंस्टेंस की सूची.
यह GenerateContentRequest.contents
और GenerateContentResponse.candidates
पर लागू होगा. हर SafetyCategory
टाइप के लिए, एक से ज़्यादा सेटिंग नहीं होनी चाहिए. एपीआई, ऐसे सभी कॉन्टेंट और जवाबों को ब्लॉक कर देगा जो इन सेटिंग के ज़रिए तय की गई थ्रेशोल्ड को पूरा नहीं करते. इस सूची में, safetySettings में बताए गए हर SafetyCategory
के लिए डिफ़ॉल्ट सेटिंग को ओवरराइड किया जाता है. अगर सूची में दिए गए किसी SafetyCategory
के लिए कोई SafetySetting
नहीं है, तो एपीआई उस कैटगरी के लिए डिफ़ॉल्ट सुरक्षा सेटिंग का इस्तेमाल करेगा. इन कैटगरी में आने वाले कॉन्टेंट की पहचान की जा सकती है: HARM_CATEGORY_HATE_SPEECH, HARM_CATEGORY_SEXUALLY_EXPLICIT, HARM_CATEGORY_DANGEROUS_CONTENT, HARM_CATEGORY_HARASSMENT, HARM_CATEGORY_CIVIC_INTEGRITY. सुरक्षा से जुड़ी उपलब्ध सेटिंग के बारे में ज़्यादा जानने के लिए, गाइड देखें. एआई ऐप्लिकेशन में सुरक्षा से जुड़ी बातों को शामिल करने का तरीका जानने के लिए, सुरक्षा से जुड़े दिशा-निर्देश भी पढ़ें.
systemInstruction
object (Content
)
ज़रूरी नहीं. डेवलपर ने सिस्टम के लिए निर्देश सेट किए हैं. फ़िलहाल, सिर्फ़ टेक्स्ट.
generationConfig
object (GenerationConfig
)
ज़रूरी नहीं. मॉडल जनरेट करने और आउटपुट के लिए कॉन्फ़िगरेशन के विकल्प.
cachedContent
string
ज़रूरी नहीं. कॉन्टेंट का वह नाम जिसे कैश मेमोरी में सेव किया गया है, ताकि अनुमान लगाने के लिए कॉन्टेक्स्ट के तौर पर इसका इस्तेमाल किया जा सके. फ़ॉर्मैट: cachedContents/{cachedContent}
अनुरोध का उदाहरण
टेक्स्ट
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
इमेज
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
ऑडियो
Python
Node.js
शुरू करें
शेल
वीडियो
Python
Node.js
शुरू करें
शेल
Python
शुरू करें
शेल
चैट करें
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
कैश मेमोरी
Python
Node.js
शुरू करें
फ़ाइन-ट्यून किया गया मॉडल
Python
JSON मोड
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
कोड को एक्ज़ीक्यूट करना
Python
शुरू करें
Kotlin
Java
फ़ंक्शन कॉलिंग
Python
शुरू करें
Node.js
शेल
Kotlin
Swift
Dart
Java
जनरेशन कॉन्फ़िगरेशन
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
सुरक्षा सेटिंग
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
सिस्टम के निर्देश
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में GenerateContentResponse
का एक इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.streamGenerateContent
यह फ़ंक्शन, इनपुट GenerateContentRequest
के आधार पर मॉडल से स्ट्रीम किया गया जवाब जनरेट करता है.
एंडपॉइंट
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=tunedModels /*}:streamGenerateContent
पाथ पैरामीटर
model
string
ज़रूरी है. Model
का नाम, जिसका इस्तेमाल जवाब जनरेट करने के लिए किया जाना है.
फ़ॉर्मैट: models/{model}
. यह tunedModels/{tunedmodel}
के फ़ॉर्म में होता है.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में, इस स्ट्रक्चर का डेटा शामिल होता है:
tools[]
object (Tool
)
ज़रूरी नहीं. Tools
की एक सूची, जिसका इस्तेमाल Model
अगले जवाब को जनरेट करने के लिए कर सकता है.
Tool
एक कोड होता है. यह सिस्टम को बाहरी सिस्टम के साथ इंटरैक्ट करने की अनुमति देता है, ताकि Model
की जानकारी और दायरे से बाहर कोई कार्रवाई या कार्रवाइयों का सेट किया जा सके. Function
और codeExecution
Tool
के साथ काम करते हैं. ज़्यादा जानने के लिए, फ़ंक्शन कॉलिंग और कोड एक्ज़ीक्यूशन गाइड देखें.
toolConfig
object (ToolConfig
)
ज़रूरी नहीं. अनुरोध में बताए गए किसी भी Tool
के लिए टूल कॉन्फ़िगरेशन. इस्तेमाल का उदाहरण देखने के लिए, फ़ंक्शन कॉलिंग गाइड देखें.
safetySettings[]
object (SafetySetting
)
ज़रूरी नहीं. असुरक्षित कॉन्टेंट को ब्लॉक करने के लिए, यूनीक SafetySetting
इंस्टेंस की सूची.
यह GenerateContentRequest.contents
और GenerateContentResponse.candidates
पर लागू होगा. हर SafetyCategory
टाइप के लिए, एक से ज़्यादा सेटिंग नहीं होनी चाहिए. एपीआई, ऐसे सभी कॉन्टेंट और जवाबों को ब्लॉक कर देगा जो इन सेटिंग के ज़रिए तय की गई थ्रेशोल्ड को पूरा नहीं करते. इस सूची में, safetySettings में बताए गए हर SafetyCategory
के लिए डिफ़ॉल्ट सेटिंग को ओवरराइड किया जाता है. अगर सूची में दिए गए किसी SafetyCategory
के लिए कोई SafetySetting
नहीं है, तो एपीआई उस कैटगरी के लिए डिफ़ॉल्ट सुरक्षा सेटिंग का इस्तेमाल करेगा. इन कैटगरी में आने वाले कॉन्टेंट की पहचान की जा सकती है: HARM_CATEGORY_HATE_SPEECH, HARM_CATEGORY_SEXUALLY_EXPLICIT, HARM_CATEGORY_DANGEROUS_CONTENT, HARM_CATEGORY_HARASSMENT, HARM_CATEGORY_CIVIC_INTEGRITY. सुरक्षा से जुड़ी उपलब्ध सेटिंग के बारे में ज़्यादा जानने के लिए, गाइड देखें. एआई ऐप्लिकेशन में सुरक्षा से जुड़ी बातों को शामिल करने का तरीका जानने के लिए, सुरक्षा से जुड़े दिशा-निर्देश भी पढ़ें.
systemInstruction
object (Content
)
ज़रूरी नहीं. डेवलपर ने सिस्टम के लिए निर्देश सेट किए हैं. फ़िलहाल, सिर्फ़ टेक्स्ट.
generationConfig
object (GenerationConfig
)
ज़रूरी नहीं. मॉडल जनरेट करने और आउटपुट के लिए कॉन्फ़िगरेशन के विकल्प.
cachedContent
string
ज़रूरी नहीं. कॉन्टेंट का वह नाम जिसे कैश मेमोरी में सेव किया गया है, ताकि अनुमान लगाने के लिए कॉन्टेक्स्ट के तौर पर इसका इस्तेमाल किया जा सके. फ़ॉर्मैट: cachedContents/{cachedContent}
अनुरोध का उदाहरण
टेक्स्ट
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
इमेज
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
ऑडियो
Python
शुरू करें
शेल
वीडियो
Python
Node.js
शुरू करें
शेल
Python
शुरू करें
शेल
चैट करें
Python
Node.js
शुरू करें
शेल
Kotlin
Swift
Dart
Java
जवाब का मुख्य भाग
अगर एपीआई सही से जुड़ जाता है, तो जवाब के मुख्य हिस्से में GenerateContentResponse
इंस्टेंस की स्ट्रीम शामिल होती है.
तरीका: tunedModels.get
इस तरीके से, किसी खास TunedModel के बारे में जानकारी मिलती है.
एंडपॉइंट
gethttps: / /generativelanguage.googleapis.com /v1beta /{name=tunedModels /*}
पाथ पैरामीटर
name
string
ज़रूरी है. मॉडल के संसाधन का नाम.
फ़ॉर्मैट: tunedModels/my-model-id
यह tunedModels/{tunedmodel}
के तौर पर दिखता है.
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
अनुरोध का उदाहरण
Python
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में TunedModel
का एक इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.list
- एंडपॉइंट
- क्वेरी पैरामीटर
- अनुरोध का मुख्य हिस्सा
- जवाब का मुख्य हिस्सा
- अनुमति पाने के लिंक
- अनुरोध का उदाहरण
इस कमांड से, ट्यून किए गए मॉडल की सूची मिलती है.
एंडपॉइंट
gethttps: / /generativelanguage.googleapis.com /v1beta /tunedModels
क्वेरी पैरामीटर
pageSize
integer
ज़रूरी नहीं. हर पेज पर, ज़्यादा से ज़्यादा TunedModels
आइटम दिखाए जा सकते हैं. ऐसा हो सकता है कि सेवा, कम फ़ाइन-ट्यून किए गए मॉडल दिखाए.
अगर इसे तय नहीं किया गया है, तो ज़्यादा से ज़्यादा 10 ट्यून किए गए मॉडल दिखेंगे. इस तरीके से, हर पेज पर ज़्यादा से ज़्यादा 1,000 मॉडल दिखते हैं. भले ही, आपने pageSize की ज़्यादा वैल्यू पास की हो.
pageToken
string
ज़रूरी नहीं. यह एक पेज टोकन है, जो पिछले tunedModels.list
कॉल से मिला था.
अगले पेज को वापस पाने के लिए, एक अनुरोध से मिले pageToken
को अगले अनुरोध के लिए आर्ग्युमेंट के तौर पर दें.
पेज नंबर के हिसाब से नतीजे दिखाने के दौरान, tunedModels.list
को दिए गए अन्य सभी पैरामीटर, पेज टोकन देने वाले कॉल से मेल खाने चाहिए.
filter
string
ज़रूरी नहीं. फ़िल्टर, ट्यून किए गए मॉडल की जानकारी और डिसप्ले नेम में पूरे टेक्स्ट की खोज करता है. डिफ़ॉल्ट रूप से, नतीजों में ऐसे ट्यून किए गए मॉडल शामिल नहीं होंगे जिन्हें सभी के साथ शेयर किया गया है.
अन्य ऑपरेटर: - owner:me - writers:me - readers:me - readers:everyone
उदाहरण: "owner:me" से, ट्यून किए गए वे सभी मॉडल दिखते हैं जिनके लिए कॉलर के पास मालिक की भूमिका है "readers:me" से, ट्यून किए गए वे सभी मॉडल दिखते हैं जिनके लिए कॉलर के पास दर्शक की भूमिका है "readers:everyone" से, ट्यून किए गए वे सभी मॉडल दिखते हैं जिन्हें सभी के साथ शेयर किया गया है
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
अनुरोध का उदाहरण
Python
जवाब का मुख्य भाग
tunedModels.list
से मिला जवाब, जिसमें मॉडल की पेज के हिसाब से बांटी गई सूची होती है.
अगर एपीआई सही से जुड़ जाता है, ताे जवाब के मुख्य भाग में नीचे दिए गए स्ट्रक्चर शामिल होता है.
tunedModels[]
object (TunedModel
)
लौटाए गए मॉडल.
nextPageToken
string
यह एक टोकन है. इसका इस्तेमाल अगले पेज को वापस पाने के लिए, pageToken
के तौर पर किया जा सकता है.
अगर इस फ़ील्ड को शामिल नहीं किया जाता है, तो इसका मतलब है कि कोई और पेज नहीं है.
JSON के काेड में दिखाना |
---|
{
"tunedModels": [
{
object ( |
तरीका: tunedModels.patch
इस तरीके का इस्तेमाल करके, फ़ाइन-ट्यून किए गए मॉडल को अपडेट किया जा सकता है.
एंडपॉइंट
patchhttps: / /generativelanguage.googleapis.com /v1beta /{tunedModel.name=tunedModels /*}
PATCH https://generativelanguage.googleapis.com/v1beta/{tunedModel.name=tunedModels/*}
पाथ पैरामीटर
tunedModel.name
string
सिर्फ़ आउटपुट के लिए. फ़ाइन-ट्यून किए गए मॉडल का नाम. बनाते समय, एक यूनीक नाम जनरेट किया जाएगा. उदाहरण: tunedModels/az2mb0bpw6i
अगर डिसप्ले नेम को बनाते समय सेट किया जाता है, तो नाम के आईडी वाले हिस्से को सेट करने के लिए, डिसप्ले नेम के शब्दों को हाइफ़न के साथ जोड़ा जाएगा. साथ ही, इसे यूनीक बनाने के लिए, इसमें एक रैंडम हिस्सा जोड़ा जाएगा.
उदाहरण:
- displayName =
Sentence Translator
- name =
tunedModels/sentence-translator-u3b7m
इसकी वैल्यूtunedModels/{tunedmodel}
होती है.
क्वेरी पैरामीटर
updateMask
string (FieldMask
format)
ज़रूरी नहीं. अपडेट किए जाने वाले फ़ील्ड की सूची.
यह फ़ील्ड के पूरी तरह से क्वालिफ़ाइड नामों की कॉमा से अलग की गई सूची है. उदाहरण: "user.displayName,photo"
.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य भाग में TunedModel
का उदाहरण है.
displayName
string
ज़रूरी नहीं. उपयोगकर्ता इंटरफ़ेस में इस मॉडल के लिए दिखने वाला नाम. डिसप्ले नेम में स्पेस के साथ-साथ 40 वर्ण होने चाहिए.
description
string
ज़रूरी नहीं. इस मॉडल के बारे में कम शब्दों में जानकारी.
tuningTask
object (TuningTask
)
ज़रूरी है. ट्यूनिंग टास्क, जिससे ट्यून किया गया मॉडल बनता है.
readerProjectNumbers[]
string (int64 format)
ज़रूरी नहीं. उन प्रोजेक्ट नंबर की सूची जिनके पास ट्यून किए गए मॉडल को पढ़ने का ऐक्सेस है.
source_model
Union type
source_model
इनमें से सिर्फ़ एक हो सकता है:tunedModelSource
object (TunedModelSource
)
ज़रूरी नहीं. TunedModel, जिसका इस्तेमाल नए मॉडल को ट्रेन करने के लिए शुरुआती पॉइंट के तौर पर किया जाएगा.
temperature
number
ज़रूरी नहीं. इससे आउटपुट में रैंडमनेस को कंट्रोल किया जाता है.
वैल्यू [0.0,1.0]
तक हो सकती हैं. 1.0
के आस-पास की वैल्यू से, अलग-अलग तरह के जवाब मिलेंगे. वहीं, 0.0
के आस-पास की वैल्यू से, मॉडल से आम तौर पर कम चौंकाने वाले जवाब मिलेंगे.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के लिए डिफ़ॉल्ट वैल्यू तय करती है.
topP
number
ज़रूरी नहीं. न्यूक्लियस सैंपलिंग के लिए.
न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को चुना जाता है. इस सेट में शामिल टोकन की संभावनाओं का योग कम से कम topP
होता है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के लिए डिफ़ॉल्ट वैल्यू तय करती है.
topK
integer
ज़रूरी नहीं. टॉप-k सैंपलिंग के लिए.
टॉप-k सैंपलिंग में, topK
सबसे ज़्यादा संभावित टोकन के सेट को ध्यान में रखा जाता है. यह वैल्यू, मॉडल को कॉल करते समय बैकएंड के लिए इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के लिए डिफ़ॉल्ट वैल्यू तय करती है.
जवाब का मुख्य भाग
कामयाब रहने पर, जवाब के मुख्य हिस्से में TunedModel
का एक इंस्टेंस शामिल किया जाता है.
तरीका: tunedModels.delete
इस तरीके का इस्तेमाल करके, फ़ाइन-ट्यून किए गए मॉडल को मिटाया जा सकता है.
एंडपॉइंट
deletehttps: / /generativelanguage.googleapis.com /v1beta /{name=tunedModels /*}
पाथ पैरामीटर
name
string
ज़रूरी है. मॉडल के संसाधन का नाम. फ़ॉर्मैट: tunedModels/my-model-id
यह tunedModels/{tunedmodel}
के तौर पर दिखता है.
अनुरोध का मुख्य भाग
अनुरोध का मुख्य हिस्सा खाली होना चाहिए.
जवाब का मुख्य भाग
अगर अनुरोध पूरा हो जाता है, तो जवाब के मुख्य हिस्से में एक खाली JSON ऑब्जेक्ट होता है.
REST रिसॉर्स: tunedModels
- संसाधन: TunedModel
- TunedModelSource
- राज्य
- TuningTask
- TuningSnapshot
- डेटासेट
- TuningExamples
- TuningExample
- हाइपरपैरामीटर
- तरीके
संसाधन: TunedModel
ModelService.CreateTunedModel का इस्तेमाल करके बनाया गया फ़ाइन-ट्यून किया गया मॉडल.
name
string
सिर्फ़ आउटपुट के लिए. फ़ाइन-ट्यून किए गए मॉडल का नाम. बनाते समय, एक यूनीक नाम जनरेट किया जाएगा. उदाहरण: tunedModels/az2mb0bpw6i
अगर डिसप्ले नेम को बनाते समय सेट किया जाता है, तो नाम के आईडी वाले हिस्से को सेट करने के लिए, डिसप्ले नेम के शब्दों को हाइफ़न के साथ जोड़ा जाएगा. साथ ही, इसे यूनीक बनाने के लिए, इसमें एक रैंडम हिस्सा जोड़ा जाएगा.
उदाहरण:
- displayName =
Sentence Translator
- name =
tunedModels/sentence-translator-u3b7m
displayName
string
ज़रूरी नहीं. उपयोगकर्ता इंटरफ़ेस में इस मॉडल के लिए दिखने वाला नाम. डिसप्ले नेम में स्पेस के साथ-साथ 40 वर्ण होने चाहिए.
description
string
ज़रूरी नहीं. इस मॉडल के बारे में कम शब्दों में जानकारी.
state
enum (State
)
सिर्फ़ आउटपुट के लिए. ट्यून किए गए मॉडल की स्थिति.
createTime
string (Timestamp
format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को बनाए जाने का टाइमस्टैंप.
यह RFC 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़्ड होता है और इसमें 0, 3, 6 या 9 फ़्रैक्शनल अंक इस्तेमाल किए जाते हैं. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
या "2014-10-02T15:01:23+05:30"
.
updateTime
string (Timestamp
format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को अपडेट किए जाने का टाइमस्टैंप.
यह RFC 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़्ड होता है और इसमें 0, 3, 6 या 9 फ़्रैक्शनल अंक इस्तेमाल किए जाते हैं. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
या "2014-10-02T15:01:23+05:30"
.
tuningTask
object (TuningTask
)
ज़रूरी है. ट्यूनिंग टास्क, जिससे ट्यून किया गया मॉडल बनता है.
readerProjectNumbers[]
string (int64 format)
ज़रूरी नहीं. उन प्रोजेक्ट नंबर की सूची जिनके पास ट्यून किए गए मॉडल को पढ़ने का ऐक्सेस है.
source_model
Union type
source_model
इनमें से सिर्फ़ एक हो सकता है:tunedModelSource
object (TunedModelSource
)
ज़रूरी नहीं. TunedModel, जिसका इस्तेमाल नए मॉडल को ट्रेन करने के लिए शुरुआती पॉइंट के तौर पर किया जाएगा.
baseModel
string
इम्यूटेबल. ट्यून करने के लिए Model
का नाम. उदाहरण: models/gemini-1.5-flash-001
temperature
number
ज़रूरी नहीं. इससे आउटपुट में रैंडमनेस को कंट्रोल किया जाता है.
वैल्यू [0.0,1.0]
तक हो सकती हैं. 1.0
के आस-पास की वैल्यू से, अलग-अलग तरह के जवाब मिलेंगे. वहीं, 0.0
के आस-पास की वैल्यू से, मॉडल से आम तौर पर कम चौंकाने वाले जवाब मिलेंगे.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के लिए डिफ़ॉल्ट वैल्यू तय करती है.
topP
number
ज़रूरी नहीं. न्यूक्लियस सैंपलिंग के लिए.
न्यूक्लियस सैंपलिंग में, टोकन के सबसे छोटे सेट को चुना जाता है. इस सेट में शामिल टोकन की संभावनाओं का योग कम से कम topP
होता है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के लिए डिफ़ॉल्ट वैल्यू तय करती है.
topK
integer
ज़रूरी नहीं. टॉप-k सैंपलिंग के लिए.
टॉप-k सैंपलिंग में, topK
सबसे ज़्यादा संभावित टोकन के सेट को ध्यान में रखा जाता है. यह वैल्यू, मॉडल को कॉल करते समय बैकएंड के लिए इस्तेमाल की जाने वाली डिफ़ॉल्ट वैल्यू के बारे में बताती है.
यह वैल्यू, मॉडल बनाते समय बेस मॉडल के लिए डिफ़ॉल्ट वैल्यू तय करती है.
JSON के काेड में दिखाना |
---|
{ "name": string, "displayName": string, "description": string, "state": enum ( |
TunedModelSource
ट्यून किए गए मॉडल को नए मॉडल को ट्रेनिंग देने के सोर्स के तौर पर इस्तेमाल किया जा सकता है.
tunedModel
string
इम्यूटेबल. TunedModel
का नाम, जिसका इस्तेमाल नए मॉडल को ट्रेन करने के लिए शुरुआती पॉइंट के तौर पर किया जाएगा. उदाहरण: tunedModels/my-tuned-model
baseModel
string
सिर्फ़ आउटपुट के लिए. उस बेस Model
का नाम जिससे इस TunedModel
को ट्यून किया गया था. उदाहरण: models/gemini-1.5-flash-001
JSON के काेड में दिखाना |
---|
{ "tunedModel": string, "baseModel": string } |
स्थिति
ट्यून किए गए मॉडल की स्थिति.
Enums | |
---|---|
STATE_UNSPECIFIED |
डिफ़ॉल्ट वैल्यू. इस वैल्यू का इस्तेमाल नहीं किया गया है. |
CREATING |
मॉडल बनाया जा रहा है. |
ACTIVE |
मॉडल इस्तेमाल के लिए तैयार है. |
FAILED |
मॉडल नहीं बनाया जा सका. |
TuningTask
ट्यूनिंग टास्क, जिनसे ट्यून किए गए मॉडल बनाए जाते हैं.
startTime
string (Timestamp
format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को ट्यून करने की प्रोसेस शुरू होने का टाइमस्टैंप.
यह RFC 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़्ड होता है और इसमें 0, 3, 6 या 9 फ़्रैक्शनल अंक इस्तेमाल किए जाते हैं. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
या "2014-10-02T15:01:23+05:30"
.
completeTime
string (Timestamp
format)
सिर्फ़ आउटपुट के लिए. इस मॉडल को ट्यून करने की प्रोसेस पूरी होने का टाइमस्टैंप.
यह RFC 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़्ड होता है और इसमें 0, 3, 6 या 9 फ़्रैक्शनल अंक इस्तेमाल किए जाते हैं. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
या "2014-10-02T15:01:23+05:30"
.
snapshots[]
object (TuningSnapshot
)
सिर्फ़ आउटपुट के लिए. ट्यूनिंग के दौरान इकट्ठा की गई मेट्रिक.
trainingData
object (Dataset
)
ज़रूरी है. सिर्फ़ इनपुट के लिए. इम्यूटेबल. मॉडल की ट्रेनिंग के लिए इस्तेमाल किया गया डेटा.
hyperparameters
object (Hyperparameters
)
इम्यूटेबल. ट्यूनिंग की प्रोसेस को कंट्रोल करने वाले हाइपरपैरामीटर. अगर यह जानकारी नहीं दी जाती है, तो डिफ़ॉल्ट वैल्यू का इस्तेमाल किया जाएगा.
JSON के काेड में दिखाना |
---|
{ "startTime": string, "completeTime": string, "snapshots": [ { object ( |
TuningSnapshot
किसी एक ट्यूनिंग चरण के लिए रिकॉर्डिंग.
step
integer
सिर्फ़ आउटपुट के लिए. ट्यूनिंग का चरण.
epoch
integer
सिर्फ़ आउटपुट के लिए. यह चरण जिस इपॉक का हिस्सा था.
meanLoss
number
सिर्फ़ आउटपुट के लिए. इस चरण के लिए, ट्रेनिंग के उदाहरणों का औसत नुकसान.
computeTime
string (Timestamp
format)
सिर्फ़ आउटपुट के लिए. इस मेट्रिक को कंप्यूट किए जाने का टाइमस्टैंप.
यह RFC 3339 का इस्तेमाल करता है. इसमें जनरेट किया गया आउटपुट हमेशा Z-नॉर्मलाइज़्ड होता है और इसमें 0, 3, 6 या 9 फ़्रैक्शनल अंक इस्तेमाल किए जाते हैं. "Z" के अलावा, अन्य ऑफ़सेट भी स्वीकार किए जाते हैं. उदाहरण: "2014-10-02T15:01:23Z"
, "2014-10-02T15:01:23.045123456Z"
या "2014-10-02T15:01:23+05:30"
.
JSON के काेड में दिखाना |
---|
{ "step": integer, "epoch": integer, "meanLoss": number, "computeTime": string } |
डेटासेट
ट्रेनिंग या पुष्टि के लिए डेटासेट.
dataset
Union type
dataset
इनमें से सिर्फ़ एक हो सकता है:examples
object (TuningExamples
)
ज़रूरी नहीं. आसान इनपुट/आउटपुट टेक्स्ट वाले इनलाइन उदाहरण.
JSON के काेड में दिखाना |
---|
{
// dataset
"examples": {
object ( |
TuningExamples
ट्यूनिंग के उदाहरणों का सेट. यह ट्रेनिंग या पुष्टि करने वाला डेटा हो सकता है.
examples[]
object (TuningExample
)
उदाहरण. इनपुट के तौर पर टेक्स्ट या बातचीत का उदाहरण दिया जा सकता है. हालांकि, एक सेट में मौजूद सभी उदाहरण एक ही तरह के होने चाहिए.
JSON के काेड में दिखाना |
---|
{
"examples": [
{
object ( |
TuningExample
ट्यूनिंग के लिए एक उदाहरण.
output
string
ज़रूरी है. मॉडल से मिलने वाला अनुमानित आउटपुट.
model_input
Union type
model_input
इनमें से सिर्फ़ एक हो सकता है:textInput
string
ज़रूरी नहीं. टेक्स्ट मॉडल का इनपुट.
JSON के काेड में दिखाना |
---|
{ "output": string, // model_input "textInput": string // Union type } |
हाइपर पैरामीटर
ट्यूनिंग की प्रोसेस को कंट्रोल करने वाले हाइपरपैरामीटर. ज़्यादा जानने के लिए, https://ai.google.dev/docs/model_tuning_guidance पर जाएं
learning_rate_option
Union type
learning_rate_option
इनमें से सिर्फ़ एक हो सकता है:learningRate
number
ज़रूरी नहीं. इम्यूटेबल. ट्यूनिंग के लिए लर्निंग रेट हाइपरपैरामीटर. अगर इसे सेट नहीं किया जाता है, तो ट्रेनिंग के उदाहरणों की संख्या के आधार पर, डिफ़ॉल्ट रूप से 0.001 या 0.0002 का हिसाब लगाया जाएगा.
learningRateMultiplier
number
ज़रूरी नहीं. इम्यूटेबल. लर्निंग रेट मल्टीप्लायर का इस्तेमाल, डिफ़ॉल्ट (सुझाई गई) वैल्यू के आधार पर फ़ाइनल लर्निंगरेट का हिसाब लगाने के लिए किया जाता है. असल लर्निंग रेट := learningRateMultiplier * डिफ़ॉल्ट लर्निंग रेट डिफ़ॉल्ट लर्निंग रेट, बेस मॉडल और डेटासेट के साइज़ पर निर्भर करता है. अगर इसे सेट नहीं किया जाता है, तो डिफ़ॉल्ट तौर पर 1.0 का इस्तेमाल किया जाएगा.
epochCount
integer
इम्यूटेबल. ट्रेनिंग के इपॉक की संख्या. एक इपॉक, ट्रेनिंग डेटा से गुज़रने वाला एक पास होता है. अगर इसे सेट नहीं किया जाता है, तो डिफ़ॉल्ट तौर पर 5 का इस्तेमाल किया जाएगा.
batchSize
integer
इम्यूटेबल. ट्यूनिंग के लिए बैच साइज़ हाइपरपैरामीटर. अगर इसे सेट नहीं किया जाता है, तो ट्रेनिंग के उदाहरणों की संख्या के आधार पर, डिफ़ॉल्ट तौर पर 4 या 16 का इस्तेमाल किया जाएगा.
JSON के काेड में दिखाना |
---|
{ // learning_rate_option "learningRate": number, "learningRateMultiplier": number // Union type "epochCount": integer, "batchSize": integer } |