Data publikacji: 12 grudnia 2024 r., ostatnia aktualizacja: 20 maja 2025 r.
Dzięki wbudowanym interfejsom API AI Twoja aplikacja internetowa może wykonywać zadania oparte na AI bez konieczności wdrażania własnych modeli AI ani zarządzania nimi.
Wymagania
Pracujemy nad ujednoliceniem tych interfejsów API w różnych przeglądarkach.
Modele
Interfejsy Prompt API, Summarizer API, Writer API i Rewriter API pobierają duży model językowy, który jest przeznaczony do działania lokalnie na komputerach stacjonarnych i laptopach. Te interfejsy API nie działają na urządzeniach mobilnych. Zanim zaczniesz korzystać z tych interfejsów API, zapoznaj się z zasadami Google dotyczącymi niedozwolonych zastosowań generatywnej AI.
Interfejsy Summarizer API, Writer API i Rewriter API obsługują tylko tryb tekstowy. Interfejs Prompt API ma funkcje multimodalne dostępne w ramach lokalnego prototypowania dla uczestników programu wczesnego dostępu.
Sprzęt
Deweloperzy i użytkownicy, którzy korzystają z funkcji używających tych interfejsów API w Chrome, muszą spełniać te wymagania. Inne przeglądarki mogą mieć inne wymagania dotyczące działania.
Interfejsy Language Detector API i Translator API działają w Chrome na komputerze. Te interfejsy API nie działają na urządzeniach mobilnych. Interfejsy Prompt API, Summarizer API, Writer API i Rewriter API działają w Chrome, gdy spełnione są te warunki:
- System operacyjny: Windows 10 lub 11, macOS 13 lub nowszy (Ventura i nowsze) lub Linux. Interfejsy API, które korzystają z Gemini Nano, nie są jeszcze obsługiwane w Chrome na Androida, iOS i ChromeOS.
- Pamięć: co najmniej 22 GB wolnego miejsca na woluminie zawierającym profil Chrome.
- GPU: co najmniej 4 GB pamięci VRAM.
- Sieć: nieograniczona transmisja danych lub połączenie bez limitu.
Dokładny rozmiar Gemini Nano może się różnić, ponieważ przeglądarka aktualizuje model. Aby sprawdzić aktualny rozmiar, otwórz chrome://on-device-internals
i przejdź do sekcji Stan modelu. Otwórz podaną ścieżkę do pliku, aby określić rozmiar modelu.
Zacznij tworzyć
Dostępnych jest kilka wbudowanych interfejsów API AI na różnych etapach rozwoju. Niektóre są dostępne w stabilnej wersji Chrome, inne w ramach testów origin trial, a jeszcze inne tylko dla uczestników programu wczesnego dostępu.
Każdy interfejs API ma własny zestaw instrukcji, które pomagają rozpocząć pracę i pobrać model zarówno w przypadku lokalnego prototypowania, jak i w środowiskach produkcyjnych z testami origin.
- Translator API
- Language Detector API
- Summarizer API
- Prompt API
- Interfejs Prompt API w rozszerzeniach Chrome zawiera szczegółowe instrukcje, które pomogą deweloperom rozszerzeń korzystać z tego interfejsu.
- Writer API i Rewriter API
- Interfejs Prompt API do użycia w rozszerzeniach Chrome
- Prompt API for web (tylko EPP)
Wszystkie te interfejsy API można wykorzystać podczas tworzenia rozszerzeń do Chrome.
Używanie interfejsów API na hoście lokalnym
Wszystkie interfejsy API są dostępne w localhost
w Chrome.
- Jedź do:
chrome://flags/#prompt-api-for-gemini-nano
. - Kliknij Włączono.
- Kliknij Uruchom ponownie lub uruchom ponownie Chrome.
Aby potwierdzić, że Gemini Nano zostało pobrane i działa zgodnie z oczekiwaniami, otwórz Narzędzia deweloperskie i wpisz w konsoli await LanguageModel.availability();
. Powinno to zwrócić available
.
Rozwiązywanie problemów z localhostem
Jeśli model nie działa zgodnie z oczekiwaniami, wykonaj te czynności:
- Uruchom ponownie Chrome.
- Jedź do:
chrome://components
. - Sprawdź, czy jest dostępna instrukcja optymalizacji na modelu urządzenia. Oznacza to, że Gemini Nano jest dostępny lub pobierany.
- Jeśli nie ma numeru wersji, kliknij Sprawdź, czy jest dostępna aktualizacja, aby wymusić pobieranie.
- Otwórz Narzędzia deweloperskie i wpisz
LanguageModel.availability();
w konsoli. Powinno zostać zwróconeavailable
.
W razie potrzeby poczekaj chwilę i powtórz te czynności.
Proces standardów
Pracujemy nad ujednoliceniem tych interfejsów API, aby działały we wszystkich przeglądarkach. Oznacza to, że zaproponowaliśmy interfejsy API społeczności platform internetowych i przenieśliśmy je do grupy społecznościowej W3C Web Incubator, aby kontynuować dyskusję.
W przypadku każdego interfejsu API prosimy o opinię W3C, Mozillę i WebKit.
Więcej informacji o tym procesie w przypadku poszczególnych interfejsów API znajdziesz w odpowiedniej dokumentacji.
Angażowanie się i przesyłanie opinii
Jeśli wypróbujesz wbudowaną AI i masz jakieś uwagi, chętnie je poznamy.
- Poznaj wszystkie wbudowane interfejsy API AI.
- Dołącz do programu wcześniejszego dostępu, aby jako pierwszy poznać nowe interfejsy API i uzyskać dostęp do naszej listy mailingowej.
- Jeśli masz uwagi na temat implementacji Chrome, zgłoś błąd w Chromium.
- Dowiedz się więcej o standardach internetowych.