大家有没有语音转文字的推荐给我下,有道,百度,讯飞都要我去开发,而我是现在就要转个音频

2018-07-28 15:13:33 +08:00
 vss80p585

在线能够转的或者是 app 都可以推荐给我下

当然关于标题,说说我自己的看法,这个是突然的需求,而且领导催着要,而这个时候肯定是立马解决,而进了这三家平台,却要做接口开发,试问,能不能做个 demo5 分钟体验? 能够给开发者解决刚需,开发者觉得不错,那下一步才是考虑接入吧!

4307 次点击
所在节点    云计算
9 条回复
vss80p585
2018-07-28 15:21:41 +08:00
SDK 接入是要时间的,开发下来黄花菜都凉了
mahonex
2018-07-28 15:59:24 +08:00
语音转文字都是坑,讯飞和百度都试过,不满足要求。现在在开始折腾 deepspeech 了。你如果是说只单纯的转一下 你试试微软或者 google 的 相关在线服务。
metorm
2018-07-28 16:33:17 +08:00
讯飞不是有个录音宝什么的吗?锤子好像也有类似的。上传到 u2b 好像也有生成字幕的功能。
incompatible
2018-07-28 16:39:44 +08:00
所以你是有多急?注册账号+看文档最多一小时、写调 sdk 的代码 10 分钟、调试半小时足够了,这样黄瓜菜就凉了?
真着急的话你可以让老板找众包。语音转文本不是只有 ASR 一条路可以走的。
hardwork
2018-07-28 23:44:06 +08:00
阿里的效果不错的,调个 post api 就可以了
jackroyal
2018-07-29 09:53:15 +08:00
微信小程序搜索百度 AI 体验中心
vss80p585
2018-07-29 19:39:03 +08:00
当时是 1.41 分钟的对话,我后来采用一台手机放音,一台手机打开讯飞语音输入法,输出到文本,由于对话语速过快,效果不好,最终采用人工录入,谢谢大家的回复;对于语音转文字,需求还是很大的,比如直播实时生成字母,之前看阿里弄直播都是实时生成,正确率率 99%,值得期待
vss80p585
2018-07-29 19:45:21 +08:00
有道,百度,讯飞,阿里都值得期待一下
HTWMedia
2020-05-09 08:13:25 +08:00
长语音识别,在线音视频识别,可以用 HTWCore,识别速度快,准确。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/474933

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX