叮当:一个开源的中文智能音箱项目

2017-05-23 09:04:15 +08:00
 wzpan

这个项目其实来源于我生活中的一个需求:我每天晚上都会去厨房做一个面包当明天的早餐,当我把用料按顺序准备好放进面包机时,我需要准确预约到明天早上我吃早餐的时间。然而,几乎每次在这个时候我都没有带手机在身边,而是都放在客厅里充电,这时只能跑去客厅看时间。虽然厨房到客厅只有几步之遥,但自己又是懒癌患者,每天都要这么来回奔波就觉得很不方便。要解决这个问题当然有很多种方法,比如直接买个小时钟放在厨房。不过我更希望“连看都不用看”,直接有人告诉我时间。所以,我需要一个像 Amazon Echo 那样的智能音箱。

然而,不论是 Amazon Echo、Google Home 还是微软 Cortana 音箱,在国内的使用都是个问题。虽然国内也有类似的智能音箱产品,但我没有用过这些产品,不知道可定制性如何。比如,如果我需要开发个功能让它告诉我某种面包的配方是什么,这些产品就不一定能做到了。考虑再三,我决定自己动手在 Raspberry Pi 上写一个。整个项目用了差不多三个星期的业余零碎时间。

5022 次点击
所在节点    Raspberry Pi
2 条回复
gamexg
2017-05-23 14:14:33 +08:00
好漂亮。
比较好奇播放音乐时上一首、下一首的识别率怎么样?

原来用国产 pi + 监控拾音器 试过 pocketsphinx 及 google、讯飞等语音识别,发现噪音干扰是个问题。
拾音器灵敏度低时远距离命令就不能识别了,灵敏度高了远距离命令能够识别,但是环境噪音因跟着高了,识别很容易被干扰。
其中 pocketsphinx 只训练有限的命令后识别效果还行,在线语音识别碰到环境噪音就经常出错。
wzpan
2017-05-23 14:38:27 +08:00
@gamexg 在播放音乐的时候,同样也是处于 Passive Listening,要语音控制也需要先喊一声叮当。然后叮当会停止播放音乐,进入 Activite Listening。这样就解决了噪音的干扰。
播放音乐的过程中,离线唤醒的成功率依然很高。因为给 PocketSphinx 的关键词很少,匹配比较好。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/363102

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX