V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
287854442
1.4D
V2EX  ›  Joe's Talk 🪐

一个大胆的预言:语音输入将成为绝对主流

  •  1
     
  •   287854442 · 1 月 27 日 via Android · 15102 次点击
    这是一个创建于 73 天前的主题,其中的信息可能已经有所发展或是发生改变。

    先说结论:大概 1~2 年之后,语音输入在移动设备上将会成为主流的输入方式。文字输入基本被淘汰,就跟现在基本没有人会用手写输入一样。

    为什么?因为效率。

    一个操作熟练的一般人大概每分钟能打 80~100 个汉字,人的说话速度大概是每分钟 160~240 个汉字。

    现在 AI 语音输入法可以识别得非常快,非常准确,基本上可以跟上说话的速度。比如说我写的这一段,用的是豆包的语音输入(利益不相关,纯佩服),一个错别字都没有改过(最多是修改一下标点符号。)甚至一些很生僻的词也能识别出来。

    当然,随着这个预测的出现,另外一个是谁能把握到这个语音输入的机会(包括软件和硬件),谁可能就会成为未来输入的统领者。这个预测的一个很大的变数是 AI 时代语音输入法门槛会比较低,做一个九十分的语音输入应该都不是一个很复杂且很费劲的事情。比的是谁能做到 99 分。

    你觉得呢?

    第 1 条附言  ·  1 月 27 日
    为了避免歧义这里稍微补充一下这里所说的 “语音输入” 的含义:

    语音 -----AI-----> 文本

    就是现有很多输入法中的 按空格说话,然后用 AI 识别语音成文本,并不是 微信中的 发语音,这是两个事情, 后者也不需要预测了
    第 2 条附言  ·  1 月 28 日

    看到很多留言让我想到 慈禧第一次看见汽车如何评价:跑这么快要吃很多草吧

    慢慢来吧,时间会说明一切

    一点点小建议:AI 时代,拿3个月之前的东西来说事儿可能都是脱钩的,keep your mind open, keep up and catch up

    Solana
    V2EX 支持通过 Solana 网络向内容作者打赏
    JoeJoeJoe 打赏了 3 次,总共 720 $V2EX
    245 条回复    2026-02-02 11:25:20 +08:00
    1  2  3  
    MavSill
        201
    MavSill  
       1 月 28 日
    @PaulSamuelson 笑死……
    flyxq
        202
    flyxq  
       1 月 28 日
    手写输入应该还活着,至少我爸妈还在用
    magicluna01
        203
    magicluna01  
       1 月 28 日
    说话比打字累,更加消耗精力,你这个判断怎么得出的?
    Aust1ng
        204
    Aust1ng  
       1 月 28 日
    做到语音输入不是问题,问题是怎么在工作中隔离别人的语音
    shanks
        205
    shanks  
       1 月 28 日
    基本同意,语音输入对九宫格来说确实提效。但是全键盘就不一定。只是说确实省事。另外识别率很重要,这个肯定需要个性化数据
    edisonwong
        206
    edisonwong  
       1 月 28 日
    语音输入在技术场景下,起码现状不行。比如一些场景:
    “dubbo 挂了,检查下 zk”
    语言大概率识别不出来
    mekingname
        207
    mekingname  
       1 月 28 日   ❤️ 1
    你试一试这个场景:

    在微信上搜索一个名字叫作“咿”的人,然后给他发信息。

    你会发现第一步你没有办法用语音输入找到这个名字。

    语音输入最致命的缺点,就是在缺乏上下文时,当一个发音的备选文字太多,但你又不知道怎么组词时,你就没法输入这个字。
    abelmakihara
        208
    abelmakihara  
       1 月 28 日
    很多人用语音输入的场合只有走路上和农药骂人吧..
    jjtang11
        209
    jjtang11  
       1 月 28 日
    很好奇你以前没用过语音输入吗,很久很久之前语音识别的准确率已经十分高了,讯飞就是靠这个起家的,你这种惊叹也早在 10 年前我第一次用讯飞输入法就发出过,然而现在我还是极少使用,身边也没人用,只有不会拼音的长辈会用
    trioon
        210
    trioon  
       1 月 28 日
    语音输入还要检查一遍,打字的话是边打边看的,实际输出速度并不差多少。
    ivy01
        211
    ivy01  
       1 月 28 日
    @Krylo 同感,不过这个只局限在工作和专业交流层面,日常和朋友家里人唠嗑 语音输入问题不大,甚至很多时候都直接发语音,都不发文字
    ludan110
        212
    ludan110  
       1 月 28 日   ❤️ 2
    其实看看 00 后 10 后他们的输入方式是怎么样的就知道了
    很多人不会对拼音输入非常的不熟练, 大部分时间用的都是语音输入
    看了评论很有意思 好多人还在沉浸在自己的世界里
    sharpy
        213
    sharpy  
       1 月 28 日
    可能将来会出现脑波输入法
    whitefable
        214
    whitefable  
       1 月 28 日
    多半会主动用语音来输入的其实大部分场景都直接发语音了,而不是转文字,何况类似于微信现在人家发语音自己也能直接转文字查看;而不爱发语音的以及很多场合根本就不能也不应该说话的场合怎么会能替代手动输入
    magicluna01
        215
    magicluna01  
       1 月 28 日
    @ludan110 有消费能力的才有话语权,年轻人有个屁的话语权
    RonnieColeman
        216
    RonnieColeman  
       1 月 28 日
    最近和 ChatGPT 聊天,就很喜欢用语音输入。它自带的语音通话,回答的太简洁了,感觉不是很好用。我用苹果自带的语音输入,转换成文字发给它,虽然会产生很多错别字,但 AI 基本都能理解我发送内容的含义,这样对话的效率很高。
    jadewant
        217
    jadewant  
       1 月 28 日
    这又让我想起来,老罗语音输入办公。

    你考虑过隐私这个东西吗?
    另外,这件事上不存在绝对。
    meteora0tkvo
        218
    meteora0tkvo  
       1 月 28 日
    语音输入在家里或其他私密场所才能整吧。在公共场合,比如地铁、办公室,扯着嗓子对着手机说话,先不说有没打扰到他人,自己不也得尴尬死
    jadewant
        219
    jadewant  
       1 月 28 日
    如果因为效率就能成为主流,也不需要等到一两年后,几年前甚至十几年前就普及了,但现实呢?
    WaterMC
        220
    WaterMC  
       1 月 28 日
    可能会是主流吧,但我自己不太喜欢这个主流。
    太吵了

    你坐在办公室,或者某个地方,旁边全是噪音,感觉还是不太好。
    JoryJoestar
        221
    JoryJoestar  
       1 月 28 日
    搞错了吧,从产品角度上来说,AI 赋能的语音输入法并不能解决人对于自己想要输入信息的可控性,语音输入是个黑盒;未来可能是这样的,像三体人那样,信息直接就用脑电波就发送了,人体接入类似赛博朋克的插件,通过脑电波输入法传递给另一个人。
    stdout
        222
    stdout  
       1 月 28 日
    @shortawn 现在的语音输入法,很小声说也能识别非常准确。私密性不太严格的场合,替换问题不大
    FaustinaD
        223
    FaustinaD  
       1 月 28 日
    确实
    我们团队目前跟 AI 沟通人手一个麦克风+语音输入法(以前是搜狗语音输入,现在改成了闪电说)
    边想边输出+让 AI 采访你(一步一步确认你的需求)是与 AI 交流最方便的方式
    打字确实不如自然语言输入更方便
    JConlee
        224
    JConlee  
       1 月 28 日
    @lqy2575395 微微发出声音就可以了,旁边人基本听不到,现在设备的收音已经非常好,未来收音设备只会越来越好。我现在上班也是语音输入、语音 coding ,也鼓励团队的人都这样。


    @IIce 语音说错字也可以删除,也可以修改,参见 typeless 的方式,甚至比打字修改更快、更方便。
    KingGaruda
        225
    KingGaruda  
       1 月 28 日
    LazyTyper + Claude Code 我认为是很高效的工作组合;日常使用不太好用的地方,包括称呼、名称以及一些语义上下文等
    lance07
        226
    lance07  
       1 月 28 日
    ai 语音输入到可用级别都多少年了,各种输入法都有啊,但是只有在路上或者外面才用,你在工位用这个么
    maojun
        227
    maojun  
       1 月 28 日 via iPhone
    @jjtang11 那是上一代语音输入法了,可以体验一下一年内的的 ai 输入法产品。解决上下文问题后语音输入法大概率有实力取代很多场景的输入方式。
    ganbuliao
        228
    ganbuliao  
       1 月 28 日
    之前讯飞输入法的语音识别贼强 但是苹果不给其他输入法语音的权限了
    skuuhui
        229
    skuuhui  
       1 月 28 日
    微信一直有语音输入也没见的成为主流,文字输入有它不可替代性。地铁上,会议上,你老婆的床上,你都没发直接语音。恰恰相反,以后更会两极分化,通过语音给 AI 做交互,剩余的场景大多数都是文字了。更纯粹。
    RuriSmzk
        230
    RuriSmzk  
       1 月 28 日 via iPhone
    毫无意义的预测
    crazycen
        231
    crazycen  
       1 月 28 日
    某些场景是有用的!(同声转译,这些已经实现,就差 AI 模型离线翻译了),但是覆盖面有限!速度快对主要单方面有利,主要是信息的获取者!增加了信息获取者处理信息的时间。甚至还没等你说完就能获取你接下来的语言,但是对于信息产生者,通过语音速度提升,优势看上去并不明显和通用。以上仅仅是我自己的看法。
    crazycen
        232
    crazycen  
       1 月 28 日
    所以后面的“绝对主流”这几个字这个我并不认同。
    Cuhn1
        233
    Cuhn1  
       1 月 28 日
    我能想到的好处就是让哪些不会说话的人至少能说“人”话。
    smlcgx
        234
    smlcgx  
       1 月 28 日 via iPhone
    说我老古董也无所谓,我不喜欢这个
    w2650489
        235
    w2650489  
       1 月 28 日
    讯飞语音输入法 早就很好用了 可是一点也不普及 还是不方便
    HankAviator
        236
    HankAviator  
       1 月 28 日
    我赞同 OP 的观点,平时用 AI 都是语音输入的,中文和其他语言混杂也能很好识别。尤其现在打字没有以前快了,语音输入很舒服。
    当然在家工作没有别人在家,所以不存在打扰其他人的情况。主流还是坐办公室吧。
    微信什么的基本也语音转文字了,准确率还行
    dog82
        237
    dog82  
       1 月 28 日
    老罗有话说:插入,变黑,加粗!
    办公室跟菜市场一样
    ronman
        238
    ronman  
       1 月 28 日
    别人我不知道,对我来说永远不可能
    drydiy
        239
    drydiy  
       1 月 28 日 via iPhone   ❤️ 1
    不可能。1. 保密性问题。2. 语音输入无法即时调整中间文案。 就这两点就杀死比赛了。
    binzack98
        240
    binzack98  
       1 月 28 日   ❤️ 1
    题主的结论:“语音输入成为绝对主流”。对于此点我认为语音输入已经算主流了,不论是语音直接发还是语音转文字。

    但语音输入绝对主流,我认为困难。

    首先题主给出结论设置了两个限定:
    一是时间,大概 1-2 年后;
    二是设备,主要针对移动设备。

    论据一,类比“就像手写输入没人用一样”,
    论据二,“效率说”。

    当然首先手写没人用这点有待商榷,但是类比的没毛病。
    其二,题主又提出两个观点,1 说话效率高于打字 2AI 语音识别很快且准确
    综合这两个观点题主去推出了“语音输入成为绝对主流”结论。

    针对观点提出反驳我看观点也比较多:
    一是:效率并非唯一标准。环境限制说,比如地铁、会议、公共场合,语音输入不适用。隐私说,就是不想让别人知道,或者说 AI 识别要联网,信息可能会被共享啥的。思考和表达不同步说,打字和口述的修改率,或者说输入和思考的谁前谁后不好定义。
    二是:AI 语音识别我认为是不是仍然有所局限。一是专业词汇,方言,口音,这块突破已经很大,但是 1-2 年能否完全解决是一个疑问。二是环境影响,高噪音、没信号等问题下,AI 语音识别能否实现媲美打字的功能(我是说功能)。

    然后这事纯逻辑判断这块啊,后续还能查找一些这个行业数据啥的,从数据的角度看是否合理。

    然后我的纯粹主观观点,我认为题主所说的“语音输入”(特指 AI 识别转文字)是会充分发展的,但是一个产品或者说一个工具,效率不是全部,对于消费者或者说用户,易用性,场景应用能力等等等等都是用户选择的,更何况是这个输入这种细分领域,这里边还能有输入法的一堆事,速录法的一堆事。最直接的结论我认为啊,直接推出来就是,AI 识别语音并转换为文字能够处于语音识别(广义)输入的绝对主流。

    如果看完我的废话,十分感谢
    287854442
        241
    287854442  
    OP
       1 月 28 日
    @binzack98 哈哈哈 一字不落看完,谢谢回复,我很喜欢这种讨论
    geniusy
        242
    geniusy  
       1 月 28 日 via Android
    用之前也觉得不可能,用之后两个字:真香。
    zslahmyyc
        243
    zslahmyyc  
       1 月 28 日
    一个大胆的回复:除了脑电波输入法,没有什么能打败手指输入
    ciki
        244
    ciki  
       1 月 29 日
    你先看看微信语音场景,语音需要在隐私的场景下,文字就不看场景了
    ha0zi
        245
    ha0zi  
       2 月 2 日
    我觉得吧, 首先要语言识别转文字的识别率高, 然后要支持各种方言
    1  2  3  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2729 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 15:04 · PVG 23:04 · LAX 08:04 · JFK 11:04
    ♥ Do have faith in what you're doing.