মিথুন মডেল টোকেন নামক ইউনিটে ইনপুট এবং আউটপুট প্রক্রিয়া করে।
টোকেন z
মত একক অক্ষর বা cat
মত পুরো শব্দ হতে পারে। দীর্ঘ শব্দগুলিকে কয়েকটি টোকেনে বিভক্ত করা হয়েছে। মডেল দ্বারা ব্যবহৃত সমস্ত টোকেনের সেটকে শব্দভাণ্ডার বলা হয় এবং টোকেনে পাঠ্য বিভক্ত করার প্রক্রিয়াটিকে টোকেনাইজেশন বলা হয়।
মিথুন মডেলের জন্য, একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য। 100 টোকেন প্রায় 60-80 ইংরেজি শব্দের সমান।
প্রতিটি মডেলের সর্বাধিক সংখ্যক টোকেন রয়েছে যা এটি একটি প্রম্পট এবং প্রতিক্রিয়াতে পরিচালনা করতে পারে। আপনার প্রম্পটের টোকেন গণনা জানা থাকলে আপনি এই সীমা অতিক্রম করেছেন কিনা তা আপনাকে জানাতে পারে। উপরন্তু, একটি অনুরোধের খরচ আংশিকভাবে ইনপুট এবং আউটপুট টোকেনের সংখ্যা দ্বারা নির্ধারিত হয়, তাই টোকেনগুলি কীভাবে গণনা করতে হয় তা জানা সহায়ক হতে পারে।
উল্লেখ্য যে জেমিনি 1.0 এবং 1.5 মডেলগুলি "বিলযোগ্য অক্ষর" গণনা এবং মূল্য নির্ধারণকেও সমর্থন করে, কিন্তু যেহেতু এই মডেলগুলি হয় অবসরপ্রাপ্ত বা শীঘ্রই অবসরপ্রাপ্ত, এই পৃষ্ঠাটি বিলযোগ্য অক্ষর সম্পর্কে কিছু বর্ণনা করে না৷
সমর্থিত মডেল
-
gemini-2.5-pro
-
gemini-2.5-flash
-
gemini-2.5-flash-lite
-
gemini-2.0-flash-001
(এবং এর স্বয়ংক্রিয়-আপডেট উপনামgemini-2.0-flash
) -
gemini-2.0-flash-lite-001
(এবং এর স্বয়ংক্রিয়-আপডেট উপনামgemini-2.0-flash-lite
) -
gemini-2.0-flash-preview-image-generation
টোকেন গণনা জন্য বিকল্প
Gemini API-এর জন্য সমস্ত ইনপুট এবং আউটপুট টেক্সট, ইমেজ ফাইল এবং অন্যান্য নন-টেক্সট পদ্ধতি সহ টোকেনাইজড। এখানে টোকেন গণনার বিকল্প রয়েছে:
- শুধুমাত্র আপনার অনুরোধের জন্য টোকেন গণনা পরীক্ষা করুন (মডেলে পাঠানোর আগে)।
- মডেলে পাঠানোর আগে অনুরোধের ইনপুট সহ
countTokens
কল করুন। এটি ফেরত দেয়:-
total_tokens
: শুধুমাত্র ইনপুটের টোকেন গণনা
-
- আপনার অনুরোধ এবং প্রতিক্রিয়া উভয়ের জন্য টোকেন গণনা পরীক্ষা করুন।
- প্রতিক্রিয়া বস্তুতে
usageMetadata
বৈশিষ্ট্য ব্যবহার করুন। এর মধ্যে রয়েছে:-
prompt_token_count
: শুধুমাত্র ইনপুটের টোকেন গণনা -
candidates_token_count
: শুধুমাত্র আউটপুটের টোকেন গণনা (চিন্তার টোকেন অন্তর্ভুক্ত নয়) -
thoughts_token_count
: প্রতিক্রিয়া তৈরি করতে ব্যবহৃত যেকোনো চিন্তার টোকেনের টোকেন গণনা -
total_token_count
: ইনপুট এবং আউটপুট উভয়ের জন্য টোকেনের মোট গণনা (যেকোন চিন্তার টোকেন অন্তর্ভুক্ত)
আউটপুট স্ট্রিম করার সময়,
usageMetadata
বৈশিষ্ট্যটি শুধুমাত্র স্ট্রিমের শেষ অংশে প্রদর্শিত হয়। মধ্যবর্তী খণ্ডগুলির জন্য এটিnil
। -
উপরের বিকল্পগুলি সম্পর্কে নিম্নলিখিত পয়েন্টগুলি নোট করুন:
- তারা ইনপুট ইমেজের সংখ্যা বা ভিডিও বা অডিও ইনপুট ফাইলে সেকেন্ডের সংখ্যা গণনা করবে না । যাইহোক, এই প্রতিটি পদ্ধতির জন্য টোকেন গণনা এই মানগুলির সাথে সম্পর্কযুক্ত হবে।
- ইনপুট টোকেন গণনায় প্রম্পট (টেক্সট এবং যেকোন ইনপুট ফাইল) সেইসাথে যেকোন সিস্টেম নির্দেশাবলী এবং টুল অন্তর্ভুক্ত থাকে।
- আউটপুট টোকেন গণনা কোনো চিন্তা টোকেন অন্তর্ভুক্ত করে না; সেগুলি একটি পৃথক ক্ষেত্রে প্রদান করা হয়।
- পরবর্তীতে এই পৃষ্ঠায় প্রতিটি ধরনের অনুরোধের জন্য নির্দিষ্ট অতিরিক্ত তথ্য পর্যালোচনা করুন।
এই বিকল্পগুলির জন্য মূল্য নির্ধারণ
countTokens
কল করা :countTokens
কল করার জন্য কোন চার্জ নেই (কাউন্ট টোকেন এপিআই)। Count Tokens API-এর সর্বোচ্চ কোটা হল প্রতি মিনিটে 3000 অনুরোধ (RPM)।usageMetadata
অ্যাট্রিবিউট ব্যবহার করা: এই অ্যাট্রিবিউটটি সবসময় প্রতিক্রিয়ার অংশ হিসেবে ফেরত দেওয়া হয় এবং এতে কোনো টোকেন বা চার্জ লাগে না।
অতিরিক্ত তথ্য
নির্দিষ্ট ধরনের অনুরোধের সাথে কাজ করার সময় এখানে কিছু অতিরিক্ত তথ্য রয়েছে।
টেক্সট ইনপুট টোকেন গণনা করুন
কোন অতিরিক্ত তথ্য.
মাল্টি-টার্ন (চ্যাট) টোকেন গণনা করুন
চ্যাট ব্যবহার করার সময় countTokens
কল করার জন্য নিম্নলিখিত নোট করুন:
- আপনি যদি চ্যাটের ইতিহাসের সাথে
countTokens
কল করেন, এটি চ্যাটের উভয় ভূমিকা থেকে মোট টোকেন গণনা ফেরত দেয় (total_tokens
)। - আপনার পরবর্তী কথোপকথনের পালা কত বড় হবে তা বোঝার জন্য, আপনি যখন
countTokens
কল করবেন তখন আপনাকে এটি ইতিহাসে যুক্ত করতে হবে।
মাল্টিমডাল ইনপুট টোকেন গণনা করুন
মাল্টিমোডাল ইনপুট সহ টোকেন গণনা সম্পর্কে নিম্নলিখিত পয়েন্টগুলি নোট করুন:
- আপনি ঐচ্ছিকভাবে টেক্সট এবং ফাইলে
countTokens
আলাদাভাবে কল করতে পারেন। - উভয় টোকেন গণনা বিকল্পের জন্য, আপনি ফাইলটি ইনলাইন ডেটা হিসাবে প্রদান করুন বা এর URL ব্যবহার করুন না কেন আপনি একই টোকেন গণনা পাবেন।
ইমেজ ইনপুট ফাইল
চিত্র ইনপুট ফাইলগুলি তাদের মাত্রার উপর ভিত্তি করে টোকেনে রূপান্তরিত হয়:
- 384 পিক্সেলের কম বা সমান উভয় মাত্রা সহ ইমেজ ইনপুট: প্রতিটি ছবি 258 টোকেন হিসাবে গণনা করা হয়।
- ইমেজ ইনপুট যা এক বা উভয় মাত্রায় বড়: প্রতিটি ছবিকে 768x768 পিক্সেলের টাইলগুলিতে ক্রপ করা হয় এবং স্কেল করা হয় এবং তারপর প্রতিটি টাইলকে 258 টোকেন হিসাবে গণনা করা হয়।
ভিডিও এবং অডিও ইনপুট ফাইল
ভিডিও এবং অডিও ইনপুট ফাইলগুলি নিম্নলিখিত নির্দিষ্ট হারে টোকেনে রূপান্তরিত হয়:
- ভিডিও: প্রতি সেকেন্ডে 263 টোকেন
- অডিও: প্রতি সেকেন্ডে 32 টোকেন
নথি (পিডিএফের মতো) ইনপুট ফাইল
পিডিএফ ইনপুট ফাইলগুলিকে চিত্র হিসাবে বিবেচনা করা হয়, তাই একটি পিডিএফের প্রতিটি পৃষ্ঠাকে একটি চিত্রের মতোই টোকেনাইজ করা হয়।