Ta strona została przetłumaczona przez Cloud Translation API.

Pierwsze kroki z wbudowaną AI

Alexandra Klepper

Data publikacji: 12 grudnia 2024 r., ostatnia aktualizacja: 20 maja 2025 r.

Dzięki wbudowanym interfejsom API AI Twoja aplikacja internetowa może wykonywać zadania oparte na AI bez konieczności wdrażania własnych modeli AI ani zarządzania nimi.

Wymagania

Pracujemy nad ujednoliceniem tych interfejsów API w różnych przeglądarkach.

Modele

Interfejsy Prompt API, Summarizer API, Writer API i Rewriter API pobierają duży model językowy, który jest przeznaczony do działania lokalnie na komputerach stacjonarnych i laptopach. Te interfejsy API nie działają na urządzeniach mobilnych. Zanim zaczniesz korzystać z tych interfejsów API, zapoznaj się z zasadami Google dotyczącymi niedozwolonych zastosowań generatywnej AI.

Interfejsy Summarizer API, Writer API i Rewriter API obsługują tylko tryb tekstowy. Interfejs Prompt API ma funkcje multimodalne dostępne w ramach lokalnego prototypowania dla uczestników programu wczesnego dostępu.

Sprzęt

Deweloperzy i użytkownicy, którzy korzystają z funkcji używających tych interfejsów API w Chrome, muszą spełniać te wymagania. Inne przeglądarki mogą mieć inne wymagania dotyczące działania.

Interfejsy Language Detector API i Translator API działają w Chrome na komputerze. Te interfejsy API nie działają na urządzeniach mobilnych. Interfejsy Prompt API, Summarizer API, Writer API i Rewriter API działają w Chrome, gdy spełnione są te warunki:

System operacyjny: Windows 10 lub 11, macOS 13 lub nowszy (Ventura i nowsze) lub Linux. Interfejsy API, które korzystają z Gemini Nano, nie są jeszcze obsługiwane w Chrome na Androida, iOS i ChromeOS.
Pamięć: co najmniej 22 GB wolnego miejsca na woluminie zawierającym profil Chrome.
Wbudowane modele powinny być znacznie mniejsze. Dokładny rozmiar może się nieznacznie różnić w zależności od aktualizacji.
GPU: co najmniej 4 GB pamięci VRAM.
Sieć: nieograniczona transmisja danych lub połączenie bez limitu.
Kluczowe pojęcie: połączenie taryfowe to połączenie internetowe z limitem danych. Połączenia Wi-Fi i Ethernet są domyślnie nielimitowane, a połączenia komórkowe są często limitowane.

Dokładny rozmiar Gemini Nano może się różnić, ponieważ przeglądarka aktualizuje model. Aby sprawdzić aktualny rozmiar, otwórz chrome://on-device-internals i przejdź do sekcji Stan modelu. Otwórz podaną ścieżkę do pliku, aby określić rozmiar modelu.

Zacznij tworzyć

Dostępnych jest kilka wbudowanych interfejsów API AI na różnych etapach rozwoju. Niektóre są dostępne w stabilnej wersji Chrome, inne w ramach testów origin trial, a jeszcze inne tylko dla uczestników programu wczesnego dostępu.

Każdy interfejs API ma własny zestaw instrukcji, które pomagają rozpocząć pracę i pobrać model zarówno w przypadku lokalnego prototypowania, jak i w środowiskach produkcyjnych z testami origin.

Translator API
Language Detector API
Summarizer API
Prompt API
- Interfejs Prompt API w rozszerzeniach Chrome zawiera szczegółowe instrukcje, które pomogą deweloperom rozszerzeń korzystać z tego interfejsu.
Writer API i Rewriter API
Interfejs Prompt API do użycia w rozszerzeniach Chrome
Prompt API for web (tylko EPP)

Wszystkie te interfejsy API można wykorzystać podczas tworzenia rozszerzeń do Chrome.

Używanie interfejsów API na hoście lokalnym

Wszystkie interfejsy API są dostępne w localhost w Chrome.

Jedź do: chrome://flags/#prompt-api-for-gemini-nano.
Kliknij Włączono.
Kliknij Uruchom ponownie lub uruchom ponownie Chrome.

Aby potwierdzić, że Gemini Nano zostało pobrane i działa zgodnie z oczekiwaniami, otwórz Narzędzia deweloperskie i wpisz w konsoli await LanguageModel.availability();. Powinno to zwrócić available.

Rozwiązywanie problemów z localhostem

Jeśli model nie działa zgodnie z oczekiwaniami, wykonaj te czynności:

Uruchom ponownie Chrome.
Jedź do: chrome://components.
Sprawdź, czy jest dostępna instrukcja optymalizacji na modelu urządzenia. Oznacza to, że Gemini Nano jest dostępny lub pobierany.
- Jeśli nie ma numeru wersji, kliknij Sprawdź, czy jest dostępna aktualizacja, aby wymusić pobieranie.
Otwórz Narzędzia deweloperskie i wpisz LanguageModel.availability(); w konsoli. Powinno zostać zwrócone available.

W razie potrzeby poczekaj chwilę i powtórz te czynności.

Proces standardów

Pracujemy nad ujednoliceniem tych interfejsów API, aby działały we wszystkich przeglądarkach. Oznacza to, że zaproponowaliśmy interfejsy API społeczności platform internetowych i przenieśliśmy je do grupy społecznościowej W3C Web Incubator, aby kontynuować dyskusję.

W przypadku każdego interfejsu API prosimy o opinię W3C, Mozillę i WebKit.

Więcej informacji o tym procesie w przypadku poszczególnych interfejsów API znajdziesz w odpowiedniej dokumentacji.

Angażowanie się i przesyłanie opinii

Jeśli wypróbujesz wbudowaną AI i masz jakieś uwagi, chętnie je poznamy.

Poznaj wszystkie wbudowane interfejsy API AI.
Dołącz do programu wcześniejszego dostępu, aby jako pierwszy poznać nowe interfejsy API i uzyskać dostęp do naszej listy mailingowej.
Jeśli masz uwagi na temat implementacji Chrome, zgłoś błąd w Chromium.
Dowiedz się więcej o standardach internetowych.