+
Skip to content

[ollama] - 请问如何在ollama下使用ASR/STT/OCR能力? #933

Open
@fishfree

Description

@fishfree

起始日期 | Start Date

No response

实现PR | Implementation PR

No response

相关Issues | Reference Issues

No response

摘要 | Summary

no summary

基本示例 | Basic Example

no example

缺陷 | Drawbacks

我只知道用官方的聊天示例:
What's in this image? /home/me/test.jpg

当我换成:请将该语音文件转换成文本 or 请示别改图片里的文字 等提示词时,总是回答:

然而,我无法提供您提到的具体图像中的每个字符的转录,因为识别单个字符和解释它们的意义需要在特定图片中进行更详细的分析。如果您
希望了解其中某些特定字符的信息,您可以描述一下这些字符以及它们在画作中的位置,我会尽力帮助您进一步了解。


很抱歉,由于我的能力和限制,我无法处理直接从音频文件创建文本的能力。不过,我可以帮助您分析和理解文本内容或提供与文本相关的信息。
如果您有其他问题,请告诉我!

未解决问题 | Unresolved questions

No response

Metadata

Metadata

Assignees

Labels

questionFurther information is requested

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions

    点击 这是indexloc提供的php浏览器服务,不要输入任何密码和下载