不懂就问:垂直领域小词汇量(纯数字)离线语音识别用什么技术

2020 年 7 月 23 日
 maitiantuzi

主要是整数和小数的识别,用什么开源框架训练,如何训练,准确率相对较高? 用过各大平台的离线识别,纯数字的识别率较低。

2267 次点击
所在节点    问与答
8 条回复
NullPoint
2020 年 7 月 23 日
同问文字方面的,中文书写,例如十一点三,这种,如何识别
ooh
2020 年 7 月 23 日
离线识别估计有点难,刚刚试了试三爽录音机里面的语音转写,它有动态修正我试了下正常语速识别率 100%
ooh
2020 年 7 月 23 日
@ooh 看了看离线识别里面的命令词好像也不适合你,查了下有个叫 https://github.com/kaldi-asr/kaldi 的项目可以看看,感觉可以满足你的需求
gargar
2020 年 7 月 24 日
什么是“垂直领域”?
fishCatcher
2020 年 7 月 24 日
各大云平台的自学习模型服务可以自己训练?
Coast
2020 年 7 月 24 日
在第一家公司就负责纯数字串的识别,因为是纯数字识别,语言模型可以固定,相对很小。识别准确率很高。通用的模型识别结果当然不如定制的
maitiantuzi
2020 年 7 月 24 日
@Coast 请问主要用的什么框架呢
Coast
2020 年 7 月 26 日
@maitiantuzi 基于 Kaldi 做的。不过其他的也都可以

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/692640

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX