9.png

海牙

今天看到有dalao分享的语音转文字的ai工具,自己用了一天,想请问这个ai工具的模型数据有人做吗?

准备弄来导出音声台本然后自己翻译,但是这个模型数据文件,老是读取不出来一些情况和语音,这个模型数据文件怎么调教呢?我不是很懂ai,如果可以调教ai的话,我想自己来调教它分享给大家,不然同人音声里面很多水声和娇喘还有舔耳声,他老是读取出来很多乱码,导致正文也是一团糟。

951141.jpg

吳明

音声应该都有附无效果音的吧?
另外whisper可调项目还挺多的,不过Const-me版好像是没有添加,此外也能去OPEN AI官网申请限额限Token数的免费API,不过需要有一定编程能力,而且限制单档25MB以下

9.png

海牙

回 1楼(吳明) 的帖子

感谢老哥,我连openai的账号都没有,只是局限于网上学一下那些什么什么ai弄这个弄那个,constme的whisper我用了,很多东西都搞不好,音声复杂一点就完全不能看了,不知道那个模型数据文件后续网上能不能找到更好的。