可能有点标题党的成分，但是我的树莓派已经吃灰很久了。所以这次写了个小程序，花一点微小的成本把树莓派改造成语音助手，何乐而不为呢？其实这个 idea 在去年 Amazon 的 Echo 没出的时候就有了，当时就写了一个，现在是一个重构版本。 Amazon 的 Echo 还是不太符合中国国情，不如试试自己搭建一个屌丝版的 Echo 吧~

这次的树莓派语音助手做成了我写的一个小工具 voicetools 的一个示例程序， voicetools 只是一个尽可能方便大家做语音合成和语音识别的一个 wrapper ，让大家一行代码完成语音识别和合成的工作。

项目地址：https://github.com/namco1992/voicetools

voicetools 介绍

语音识别及语音合成

from voicetools import BaiduVoice
# api key 及 secret key 请在百度语音官方网站注册获取
token = BaiduVoice.get_baidu_token('YOUR_VOICE_API_KEY', 'YOUR_VOICE_SECRET')
bv = BaiduVoice(token)
# 语音识别
results = bv.asr('path/to/your/audio/file')  # 返回识别结果列表，可选参数见百度语音文档
# 语音合成
audio = bv.tts('你好')  # 返回 MP3 格式二进制数据，可选参数见百度语音文档

还集成了两个 AI 类型的 API ，就不占篇幅了，有兴趣可以移步项目地址查看。

树莓派语音助手介绍

简介

该示例程序基于 voicetools ，遵循最简单的 one-in-one-out ，只需要在该示例程序的基础上添加关键词和对应执行的动作，就可以扩展成为个性化的专属助手。目前示例程序实现的功能有语音提醒及今明两天天气预报查询。

特性

使用 redis 作缓存，提升语音助手的反应速度。同样的问题，第二遍不再发生网络请求。
使用图灵机器人 API ，除了预设功能外，所有问题都会有答案。
非常简单的“ receive-process-execute-feedback ”逻辑，易于扩展。
有一个心情阈值，目前是预设在配置文件中的。不一定会对你的命令言听计从。（只是为了好玩）

需要准备什么？

一块树莓派
一个麦克风
一个扬声器
一个传感器（用于唤醒语音助手，我使用的是声音传感器，当然任何传感器都可以）

如何运行和扩展？

扩展只需三步，且只需要关注你要实现的功能即可。请移步项目地址参考实例。

最后，如果大家有兴趣的话，请给个 star 鼓励一下，非常感谢~

如果有任何问题，欢迎 PR 和 Issue 。

语音

voicetools

树莓

助手

58 replies • 2017-06-16 13:22:51 +08:00

roadna

Aug 29, 2016

我的树莓派还真在吃灰。支持一个。

namco1992

Aug 29, 2016

@roadna 哈哈，我的已经吃灰一年多了...

andyhuzhill

Aug 29, 2016

我的树莓派已经吃灰 3 年了现在只在上面跑个 HTTP 代理 FQ

namco1992

Aug 29, 2016

@andyhuzhill 能用起来就不算吃灰吧~我现在改成语音助手之后，早上起来问下天气，然后记点今天该做的事情。虽然手机都能做，但是语音最大的优点就是 hands-off ，拍拍手就能发指令，不用找手机了。

manhere

Aug 29, 2016 via iPhone

麦克风和语音传感器不是重复吗？

cnkuner

Aug 29, 2016 via Android

被某人破解后 24 小时监听。嗯啊嗯啊卡木昂

huangtao728

Aug 29, 2016 via Android

比较好奇心情阈值大概是什么效果?

namco1992

Aug 29, 2016

@manhere 麦克风拿来做唤醒的话很困难，而传感器就比较方便，阈值可调。还有就是，传感器唤醒的话并不限于语音传感器，距离感应、光感应都可以，比如说挥挥手唤醒之类的，可玩性好一点。

namco1992

Aug 29, 2016

@huangtao728 就只是做着玩的...比如说阈值是 0.6 ，就是有 60%的概率是积极心态回复， 40%是消极回复。但是积极回复和消极回复的文本都是写在配置文件中的，并不是随机。

namco1992

Aug 29, 2016

@huangtao728 还有就是这个心情阈值只是影响回复的内容，并不会真的拒绝执行指令，当然想要真的拒绝执行指令也不是不可以...

scnace

Aug 29, 2016 via Android

吃灰一年的来看看。。。然后继续吃灰

namco1992

Aug 29, 2016

@cnkuner 呃，保证连接自己的 wifi 并且保护 wifi 安全风险会小一点吧...

huangtao728

Aug 29, 2016 via Android

@namco1992
挺有意思啊，相当于加入了情绪的积累？
不过我以为是太过频繁发问就消极回复，消极程度递增...

SkyEcho

Aug 30, 2016

树莓派这个东西，做语音助手，最主要的问题在于，远距离（ 5m ）声音采集和降噪。
http://www.xfyun.cn/services/mic#list_wrap 讯飞的五麦环形阵列

namco1992

Aug 30, 2016

@a302800411 有条件当然可以上更好的装备，但是我只是想让吃灰的树莓派发挥下余热，花点小成本还 ok 。如果专门为了这个买个麦克风阵列，就有点背离初衷了呢~

namco1992

Aug 30, 2016

@huangtao728 你的想法也不错啊，但是这个功能只是锦上添花做着玩玩而已，所以暂时还没考虑更复杂的逻辑

wensonsmith

Aug 30, 2016

支持！好项目~

garyalen

Aug 30, 2016 via Android

安个 Google now

ijse

Aug 30, 2016

之前做过一个，用的是国外一个开源语音识别项目，配置起来很麻烦。。

最终效果也不太好，麦克风稍离远一点，识别成功率直线下降

namco1992

Aug 30, 2016

@ijse 是的，我也尝试了很多方法，最后选了百度语音的 API ，并且也没有选用 SDK ，就是为了最大程度上做到开箱即用，不要配置太麻烦，把热情都磨没了。
然后识别率的话...只能说一分钱一分货，不差钱就可以像上面哥们一样上阵列...

namco1992

Aug 30, 2016

@lan894734188 去年的时候尝试过 google 的 TTS ，现在貌似也不对外提供服务了。并且由于中国国情，使用起来也不甚方便。至于 google now 还没有尝试过呢~

Phariel

Aug 30, 2016 via Android

淘宝上有卖科大讯飞 TTS 的 Arduino 模块我买了一个还没用过太懒了。。。

anym0us

Aug 30, 2016

还能有其他玩法嘛,买来装了个 KALI 然后嘿嘿嘿,

goreliu

Aug 30, 2016

问题是，如果在手机上就可以实现，为什么要常年开着一个树莓派在那耗电。而且天气预报之类还是看比听更直观。语言提醒的话，总不能抱着树莓派各地跑，而手机要方便很多。

很多和树莓派相关的用法，都存在这个问题。

namco1992

Aug 30, 2016

@goreliu 呃，我只是实现一个摆在家里的语音助手，并没有打算移动它。你可以参考 Amazon 的 Echo 。至于功能的话，我的初衷是我实现两个小功能抛砖引玉，理论上来说有了语音输入和对应的关键词输出，可以自行实现任何功能搭配起来。

rainsun

Aug 30, 2016

手动 mark

achaocha

Aug 30, 2016

手动 mark

Flygoat

Aug 30, 2016 via iPad

借楼问一下各位知道 RPI3 有 Aarch64 下 HardFP 的编译器吗？还有 VideoCore IV 的 VC04_services 驱动有 Aarch64 的替代品吗？

t0byxdd

Aug 30, 2016

表示树莓派现在就做梯子用。。。

wujunze

Aug 30, 2016

感谢分享可以试试

tabris17

Aug 30, 2016

声音传感器唤醒树莓派这个怎么弄？

ksc010

Aug 30, 2016

楼主用的 usb 的麦克吗？
我想适配蓝牙耳机的

missdeer

Aug 30, 2016

其实我想要楼主的麦克风 /扬声器 /传感器 taobao 链接

namco1992

Aug 30, 2016

@missdeer ::doge:: 这个随便找吧，我也是买的最普通的，那些卖数电模电器件的店都有的

namco1992

Aug 30, 2016

@tabris17 首先设定好你的传感器信号输入端，我是用的 4 ，然后设置初始电平，如果是初始高电平，亦即检测到下降沿时唤醒树莓派，然后搞一个 loop 持续监测就可以了。代码你可以参考 https://github.com/namco1992/voicetools/blob/master/examples/raspi_assistant/assistant.py

namco1992

Aug 30, 2016

@ksc010 我是用的 USB 的麦克风，蓝牙的确没有试过，我的是 2 代树莓派，也没买蓝牙适配器。蓝牙的话可能声音的输入输出都需要另外设置。

tabris17

Aug 30, 2016

@namco1992 就是树莓派通过 GPIO 连接传感器，然后树莓派上跑个进程，轮询传感器的数据。也就是说树莓派是一直“醒”着的咯？否则怎么跑进程轮询呢？

namco1992

Aug 30, 2016

@tabris17 我对“醒”的定义是树莓派接收到声音信号，进入接收语音指令的状态。在没有接收到声音信号时，肯定是需要一个进程来进行下降沿检测，但是我认为这时候并不是“醒”。

tabris17

Aug 30, 2016

@namco1992 原来如此，明白了，谢谢啦

xuecat

Aug 30, 2016

唉，我还是吃灰吧！我估计我配不来。

namco1992

Aug 30, 2016

@tabris17 不客气~

namco1992

Aug 30, 2016

@xuecat 哈哈，我觉得我把步骤写得比较详尽了呢，应该不至于太复杂吧。不试试怎么就说做不来呢

vikeria

Aug 30, 2016 via iPhone

吃灰加一，偶尔拿出来跑点东西

cpp255

Aug 30, 2016

吃灰中，之前还当下载用了

mumuy

Aug 31, 2016

3 出来的时候就买了，一直没用

namco1992

Aug 31, 2016

@mumuy 3 自带了 wifi 和蓝牙，应该还是会方便很多吧

lavande

Aug 31, 2016

我之前也有这样的想法，实际上研究了好一阵子，发现有不少开源的代码可以用，然而不知道买什么样的扬声器和麦克风！同求淘宝链接示范。。。。。

namco1992

Aug 31, 2016

@lavande 麦克风搜“树莓派麦克风”，扬声器就搜“小音箱 3.5mm ”，或者你想用 USB 接口的也行。主要是我之前买的店家已经下架了，所以你自行挑选就好了，都大同小异。

ThomasZ

Aug 31, 2016

看到这个我才想起来我还有一块 pi 。。。。回来好好研究一下这个

lavande

Aug 31, 2016

@namco1992 好嘞，多谢

mimicom

Sep 2, 2016

艾玛. 哈哈. 早就有这个想法, 还注册了讯飞的 api . 还没用.

mimicom

Sep 2, 2016

怎么百度的 sdk 除了安卓就是 ios 的. 没有 linux / windows 平台的啊.

namco1992

Sep 3, 2016

@mimicom 所以我才用的 API 啊...如果你要用 SDK 的话，还是讯飞的最全最强吧，只是百度的比较接互联网的地气而已。

garyalen

Sep 20, 2016 via Android

@namco1992 GCP 有提供 api

min614130

Oct 25, 2016

能问个问题吗？ record.wav 是做什么用的？需要提前录音放进去吗？报错提示 No such file or directory: 'record.wav'

namco1992

Oct 25, 2016

@min614130 “ record.wav ”是一个缓存文件，存储了你最后一次录音，在后续做语音识别时会用到。

然后建议你贴出完整的 traceback 信息，不然我也没法判断是哪里出了问题。

最后你可以把问题提至： https://github.com/namco1992/voicetools/issues

min614130

Oct 26, 2016

@namco1992 谢谢，问题解决了

mrcong

Jun 16, 2017

我的树莓派一边吃灰一边跑打印机 airPrint 服务

你的树莓派还在吃灰吗？来试试把它改造成语音助手吧！

voicetools 介绍

语音识别及语音合成

树莓派语音助手介绍

简介

特性

需要准备什么？

如何运行和扩展？