别人都在关心千问发布会上点奶茶,而我却关注……

2 天前
 unt
千问发布会上演示语音交互时,如果现场嘈杂,甚至夹杂台下人声,是如何做到语音模型不会误输入的,背后的媒体技术是什么,降噪是如何处理的,是话筒自带降噪还是需要额外佩戴降噪麦克风,如果额外佩戴麦克风,那会不会受到扬声器音响的影响。
如果有性价比比较高的设备,求推荐
1562 次点击
所在节点    问与答
4 条回复
geomancy
2 天前
如果是特定演示者进行交互,也可以通过识别声纹定位到演示者。
unt
2 天前
@geomancy 嗯,后面可以试下
Cabana
1 天前
阵列麦克风,指向性麦克风,然后再做个实时降噪处理
Meteora626
1 天前
这是两码事,现在开源的语音模型都可以区分说话人了,你可以看看阿里开源的 asrfun 降噪、说话人识别 一堆模型

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1191482

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX