先说结论:大概 1~2 年之后,语音输入在移动设备上将会成为主流的输入方式。文字输入基本被淘汰,就跟现在基本没有人会用手写输入一样。
为什么?因为效率。
一个操作熟练的一般人大概每分钟能打 80~100 个汉字,人的说话速度大概是每分钟 160~240 个汉字。
现在 AI 语音输入法可以识别得非常快,非常准确,基本上可以跟上说话的速度。比如说我写的这一段,用的是豆包的语音输入(利益不相关,纯佩服),一个错别字都没有改过(最多是修改一下标点符号。)甚至一些很生僻的词也能识别出来。
当然,随着这个预测的出现,另外一个是谁能把握到这个语音输入的机会(包括软件和硬件),谁可能就会成为未来输入的统领者。这个预测的一个很大的变数是 AI 时代语音输入法门槛会比较低,做一个九十分的语音输入应该都不是一个很复杂且很费劲的事情。比的是谁能做到 99 分。
你觉得呢?
看到很多留言让我想到 慈禧第一次看见汽车如何评价:跑这么快要吃很多草吧
慢慢来吧,时间会说明一切
一点点小建议:AI 时代,拿3个月之前的东西来说事儿可能都是脱钩的,keep your mind open, keep up and catch up
201
MavSill 1 月 28 日
@PaulSamuelson 笑死……
|
202
flyxq 1 月 28 日
手写输入应该还活着,至少我爸妈还在用
|
203
magicluna01 1 月 28 日
说话比打字累,更加消耗精力,你这个判断怎么得出的?
|
204
Aust1ng 1 月 28 日
做到语音输入不是问题,问题是怎么在工作中隔离别人的语音
|
205
shanks 1 月 28 日
基本同意,语音输入对九宫格来说确实提效。但是全键盘就不一定。只是说确实省事。另外识别率很重要,这个肯定需要个性化数据
|
206
edisonwong 1 月 28 日
语音输入在技术场景下,起码现状不行。比如一些场景:
“dubbo 挂了,检查下 zk” 语言大概率识别不出来 |
207
mekingname 1 月 28 日 你试一试这个场景:
在微信上搜索一个名字叫作“咿”的人,然后给他发信息。 你会发现第一步你没有办法用语音输入找到这个名字。 语音输入最致命的缺点,就是在缺乏上下文时,当一个发音的备选文字太多,但你又不知道怎么组词时,你就没法输入这个字。 |
208
abelmakihara 1 月 28 日
很多人用语音输入的场合只有走路上和农药骂人吧..
|
209
jjtang11 1 月 28 日
很好奇你以前没用过语音输入吗,很久很久之前语音识别的准确率已经十分高了,讯飞就是靠这个起家的,你这种惊叹也早在 10 年前我第一次用讯飞输入法就发出过,然而现在我还是极少使用,身边也没人用,只有不会拼音的长辈会用
|
210
trioon 1 月 28 日
语音输入还要检查一遍,打字的话是边打边看的,实际输出速度并不差多少。
|
212
ludan110 1 月 28 日 其实看看 00 后 10 后他们的输入方式是怎么样的就知道了
很多人不会对拼音输入非常的不熟练, 大部分时间用的都是语音输入 看了评论很有意思 好多人还在沉浸在自己的世界里 |
213
sharpy 1 月 28 日
可能将来会出现脑波输入法
|
214
whitefable 1 月 28 日
|
215
magicluna01 1 月 28 日
@ludan110 有消费能力的才有话语权,年轻人有个屁的话语权
|
216
RonnieColeman 1 月 28 日
最近和 ChatGPT 聊天,就很喜欢用语音输入。它自带的语音通话,回答的太简洁了,感觉不是很好用。我用苹果自带的语音输入,转换成文字发给它,虽然会产生很多错别字,但 AI 基本都能理解我发送内容的含义,这样对话的效率很高。
|
217
jadewant 1 月 28 日
这又让我想起来,老罗语音输入办公。
你考虑过隐私这个东西吗? 另外,这件事上不存在绝对。 |
218
meteora0tkvo 1 月 28 日
|
219
jadewant 1 月 28 日
如果因为效率就能成为主流,也不需要等到一两年后,几年前甚至十几年前就普及了,但现实呢?
|
220
WaterMC 1 月 28 日
可能会是主流吧,但我自己不太喜欢这个主流。
太吵了 你坐在办公室,或者某个地方,旁边全是噪音,感觉还是不太好。 |
221
JoryJoestar 1 月 28 日
搞错了吧,从产品角度上来说,AI 赋能的语音输入法并不能解决人对于自己想要输入信息的可控性,语音输入是个黑盒;未来可能是这样的,像三体人那样,信息直接就用脑电波就发送了,人体接入类似赛博朋克的插件,通过脑电波输入法传递给另一个人。
|
223
FaustinaD 1 月 28 日
确实
我们团队目前跟 AI 沟通人手一个麦克风+语音输入法(以前是搜狗语音输入,现在改成了闪电说) 边想边输出+让 AI 采访你(一步一步确认你的需求)是与 AI 交流最方便的方式 打字确实不如自然语言输入更方便 |
224
JConlee 1 月 28 日
@lqy2575395 微微发出声音就可以了,旁边人基本听不到,现在设备的收音已经非常好,未来收音设备只会越来越好。我现在上班也是语音输入、语音 coding ,也鼓励团队的人都这样。
@IIce 语音说错字也可以删除,也可以修改,参见 typeless 的方式,甚至比打字修改更快、更方便。 |
225
KingGaruda 1 月 28 日
LazyTyper + Claude Code 我认为是很高效的工作组合;日常使用不太好用的地方,包括称呼、名称以及一些语义上下文等
|
226
lance07 1 月 28 日
ai 语音输入到可用级别都多少年了,各种输入法都有啊,但是只有在路上或者外面才用,你在工位用这个么
|
227
maojun 1 月 28 日 via iPhone
@jjtang11 那是上一代语音输入法了,可以体验一下一年内的的 ai 输入法产品。解决上下文问题后语音输入法大概率有实力取代很多场景的输入方式。
|
228
ganbuliao 1 月 28 日
之前讯飞输入法的语音识别贼强 但是苹果不给其他输入法语音的权限了
|
229
skuuhui 1 月 28 日
微信一直有语音输入也没见的成为主流,文字输入有它不可替代性。地铁上,会议上,你老婆的床上,你都没发直接语音。恰恰相反,以后更会两极分化,通过语音给 AI 做交互,剩余的场景大多数都是文字了。更纯粹。
|
230
RuriSmzk 1 月 28 日 via iPhone
毫无意义的预测
|
231
crazycen 1 月 28 日
某些场景是有用的!(同声转译,这些已经实现,就差 AI 模型离线翻译了),但是覆盖面有限!速度快对主要单方面有利,主要是信息的获取者!增加了信息获取者处理信息的时间。甚至还没等你说完就能获取你接下来的语言,但是对于信息产生者,通过语音速度提升,优势看上去并不明显和通用。以上仅仅是我自己的看法。
|
232
crazycen 1 月 28 日
所以后面的“绝对主流”这几个字这个我并不认同。
|
233
Cuhn1 1 月 28 日
我能想到的好处就是让哪些不会说话的人至少能说“人”话。
|
234
smlcgx 1 月 28 日 via iPhone
说我老古董也无所谓,我不喜欢这个
|
235
w2650489 1 月 28 日
讯飞语音输入法 早就很好用了 可是一点也不普及 还是不方便
|
236
HankAviator 1 月 28 日
我赞同 OP 的观点,平时用 AI 都是语音输入的,中文和其他语言混杂也能很好识别。尤其现在打字没有以前快了,语音输入很舒服。
当然在家工作没有别人在家,所以不存在打扰其他人的情况。主流还是坐办公室吧。 微信什么的基本也语音转文字了,准确率还行 |
237
dog82 1 月 28 日
老罗有话说:插入,变黑,加粗!
办公室跟菜市场一样 |
238
ronman 1 月 28 日
别人我不知道,对我来说永远不可能
|
239
drydiy 1 月 28 日 via iPhone 不可能。1. 保密性问题。2. 语音输入无法即时调整中间文案。 就这两点就杀死比赛了。
|
240
binzack98 1 月 28 日 题主的结论:“语音输入成为绝对主流”。对于此点我认为语音输入已经算主流了,不论是语音直接发还是语音转文字。
但语音输入绝对主流,我认为困难。 首先题主给出结论设置了两个限定: 一是时间,大概 1-2 年后; 二是设备,主要针对移动设备。 论据一,类比“就像手写输入没人用一样”, 论据二,“效率说”。 当然首先手写没人用这点有待商榷,但是类比的没毛病。 其二,题主又提出两个观点,1 说话效率高于打字 2AI 语音识别很快且准确 综合这两个观点题主去推出了“语音输入成为绝对主流”结论。 针对观点提出反驳我看观点也比较多: 一是:效率并非唯一标准。环境限制说,比如地铁、会议、公共场合,语音输入不适用。隐私说,就是不想让别人知道,或者说 AI 识别要联网,信息可能会被共享啥的。思考和表达不同步说,打字和口述的修改率,或者说输入和思考的谁前谁后不好定义。 二是:AI 语音识别我认为是不是仍然有所局限。一是专业词汇,方言,口音,这块突破已经很大,但是 1-2 年能否完全解决是一个疑问。二是环境影响,高噪音、没信号等问题下,AI 语音识别能否实现媲美打字的功能(我是说功能)。 然后这事纯逻辑判断这块啊,后续还能查找一些这个行业数据啥的,从数据的角度看是否合理。 然后我的纯粹主观观点,我认为题主所说的“语音输入”(特指 AI 识别转文字)是会充分发展的,但是一个产品或者说一个工具,效率不是全部,对于消费者或者说用户,易用性,场景应用能力等等等等都是用户选择的,更何况是这个输入这种细分领域,这里边还能有输入法的一堆事,速录法的一堆事。最直接的结论我认为啊,直接推出来就是,AI 识别语音并转换为文字能够处于语音识别(广义)输入的绝对主流。 如果看完我的废话,十分感谢 |
242
geniusy 1 月 28 日 via Android
用之前也觉得不可能,用之后两个字:真香。
|
243
zslahmyyc 1 月 28 日
一个大胆的回复:除了脑电波输入法,没有什么能打败手指输入
|
244
ciki 1 月 29 日
你先看看微信语音场景,语音需要在隐私的场景下,文字就不看场景了
|
245
ha0zi 2 月 2 日
我觉得吧, 首先要语言识别转文字的识别率高, 然后要支持各种方言
|