Giới thiệu Google AI Edge Portal: Đo điểm chuẩn AI trên thiết bị Edge trên quy mô lớn. Đăng ký để yêu cầu quyền truy cập trong bản xem trước riêng tư.

Trang này được dịch bởi Cloud Translation API.

Tăng tốc NPU bằng LiteRT Next

LiteRT Next cung cấp một giao diện hợp nhất để sử dụng Đơn vị xử lý thần kinh (NPU) mà không bắt buộc bạn phải điều hướng riêng lẻ các trình biên dịch, thời gian chạy hoặc phần phụ thuộc thư viện dành riêng cho nhà cung cấp. Việc sử dụng LiteRT Next để tăng tốc NPU giúp tránh nhiều vấn đề phức tạp dành riêng cho nhà cung cấp hoặc thiết bị, tăng hiệu suất cho suy luận theo thời gian thực và mô hình lớn, đồng thời giảm thiểu việc sao chép bộ nhớ thông qua việc sử dụng bộ đệm phần cứng không sao chép.

Nếu bạn đã đăng ký tham gia Chương trình tiếp cận sớm NPU LiteRT, hãy đăng nhập vào tài khoản được uỷ quyền để xem tài liệu về NPU. Nếu bạn chưa đăng ký, hãy đăng ký tham gia Chương trình tiếp cận sớm:

Đăng ký ngay!

Bắt đầu

Để bắt đầu, hãy xem hướng dẫn tổng quan về NPU:

Đối với các mô hình học máy cổ điển, hãy tiếp tục trực tiếp với khung cốt lõi:
- Tăng tốc NPU bằng LiteRT Next
Đối với Mô hình ngôn ngữ lớn (LLM), bạn nên sử dụng khung LiteRT-LM của chúng tôi để xử lý quy trình xử lý bắt buộc từ đầu đến cuối cho việc thực thi NPU:
- Tăng tốc NPU bằng LiteRT-LM

Để biết ví dụ về cách triển khai LiteRT Next có hỗ trợ NPU, hãy tham khảo các ứng dụng minh hoạ sau:

Nhà cung cấp NPU

LiteRT Next hỗ trợ tính năng tăng tốc NPU với các nhà cung cấp sau: