Ускорение NPU с помощью LiteRT Далее

LiteRT Next предоставляет унифицированный интерфейс для использования нейронных процессоров (NPU), не заставляя вас индивидуально ориентироваться в компиляторах, средах выполнения или зависимостях библиотек, специфичных для конкретного поставщика. Использование LiteRT Next для ускорения NPU позволяет избежать многих осложнений, специфичных для конкретного поставщика или устройства, повышает производительность для вывода в реальном времени и больших моделей и минимизирует копии памяти за счет использования аппаратного буфера с нулевым копированием.

Если вы уже зачислены в программу раннего доступа LiteRT NPU, войдите в авторизованную учетную запись, чтобы просмотреть документацию NPU. Если вы еще не зачислены, зарегистрируйтесь в программе раннего доступа:

Подпишитесь!

Начать

Для начала ознакомьтесь с обзорным руководством NPU:

  • Для классических моделей машинного обучения приступайте непосредственно к базовой структуре:
  • Для больших языковых моделей (LLM) мы рекомендуем использовать нашу платформу LiteRT-LM для выполнения необходимой сквозной обработки для выполнения NPU:

Примеры реализаций LiteRT Next с поддержкой NPU см. в следующих демонстрационных приложениях:

Поставщики НПУ

LiteRT Next поддерживает ускорение NPU со следующими поставщиками: