O LiteRT Next oferece uma interface unificada para usar unidades de processamento neural (NPUs) sem precisar navegar individualmente por compiladores, tempos de execução ou dependências de biblioteca específicos do fornecedor. O uso do LiteRT Next para aceleração de NPU evita
muitas complicações específicas do fornecedor ou do dispositivo, aumenta o desempenho para
inferência em tempo real e de modelos grandes e minimiza cópias de memória usando
buffers de hardware de cópia zero.
Se você já estiver inscrito no programa de acesso antecipado da NPU LiteRT, faça login na conta autorizada para acessar a documentação da NPU. Se você não se inscreveu, faça isso no Programa de acesso antecipado:
Para modelos de linguagem grandes (LLMs), recomendamos usar nosso framework LiteRT-LM para processar a execução de ponta a ponta necessária para a execução da NPU:
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-07-10 UTC."],[],[]]