一个想不明白的问题, ai 如此牛逼,为什么没有一款类同声传译?

271 天前
 zjvbqla

应该很有市场啊?

2116 次点击
所在节点    问与答
13 条回复
kdwnil
271 天前
印象中 Skype 在几年前就支持了
coderluan
271 天前
重要场合的同声传译要求很高,AI 还达不到要求。非重要的场合的话,我认为其实目前 AI 已经足够了,但是技术到实际应用也是需要过程的,用户的信任度和使用习惯的培养需要过程,目前的话,还没到那个阶段,AI 转文字已经很普及了,但是 AI 转文字再翻译实际上还在推广,Zoom 有了,Teams 还没有。AI 转文字翻译再转语音,肯定还需要时间。
xxfye
271 天前
之前参与一些产学研会议,外国人演讲的时候,都有实时翻译了。
1~2 秒内就能给出对应的中文,不过准确率不太搞,而且英文语法和中文不一样,导致句子看起来非常奇怪。
过了 5~6 秒后,就能结合上下文纠正过来了,语句也变得很通顺了。
不过涉及到复杂的专业名词就抓瞎了,句子要么不可读,要么完全错误。
Biggoldfish
271 天前
ETiV
271 天前
<amp-youtube data-videoid="Nu-nlQqFCKg" layout="responsive" width="480" height="270"></amp-youtube>
给你涨涨见识,这已经是 10 年前的视频了
着急的话可以从 7:10 开始看
2232588429
271 天前
有没有一种可能,“如此牛逼” 就是个假命题?
bianhui
271 天前
因为现阶段的 AI 说白了就是个大号的 swicth+正则表达式。和智能毫无关系。底子上的问题
Qiss
271 天前
Teams 也带会议实时字幕的,只是服务可能没有免费给普罗大众,所以很多都不知道吧
wonderfulcxm
271 天前
油管自动翻译的字幕是不是?
winterx
271 天前
sentinelK
271 天前
"为什么没有一款类同声传译"
有。但准确率和安全性不高。

准确率:本来音视频交流对延时就敏感,如果准确率再不高,就很容易误会对方的意思。
安全性:机器学习的模型、参数、推演逻辑不可检视,你没法事先证明这个模型是否被投毒和恶意训练。也没法证明这个模型不会被对抗攻击。
nothingistrue
271 天前
同声翻译,是「一个学生配一个老师」的资源配置。AI 翻译,是「一个老师配成千上万个学生」的资源配置。
LuckyPocketWatch
270 天前
同声传译可以分解为 3 步

1 声音转文字,这个功能我最早接触是在 word2003 ,会给你一段几百字的文字,让你先读一遍。
2 文字翻译,这个功能最广泛,各种翻译软件
3 文字转语音,这个完全没技术难度

个人觉得如果有大厂花钱的话,这玩意早出来了,更多的是缺乏市场,翻译这块,人工的费用并不贵,再加上教育不断完善,使得很多人都会说外语,这使得公司缺乏研发的动力

就语音识别来说,各个音乐 APP 的歌词识别老流弊了。。。。我并不觉得一段说的话比唱的话更难识别。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/965944

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX