直接通过说话来写代码能做吗？

simpleliang

2018-05-18 13:44:41 +08:00

https://github.com/liangjingyang/voice_kit
前段时间脑袋一热, 动手试了试. 自己做了一个. 正如 @SuperMild #53 楼说的那样, 想实现的只是一个辅助工具.

遇到的问题及思考 ( 还未动手尝试 ) :
1. 这种工具要用顺, 用来连接语音识别结果 ( 文本 ) 和执行的操作 ( 命令 ) 的中间层很重要, 其实就相当于一套适合的 api.
2. 语音 -> 文本的准确率的问题, 想到一个优化的方法: 因为每个人的口音都不太一样, 在使用工具之前, 给一篇涵盖语素相对比较全面的文章让使用者朗读, 构建一个个人语素对标准语素(比如普通话)的映射关系, 用来辅助提高识别的准确率. 但对语音识别了解不多, 不知道可行性如何.
3. 我这个项目比较简单粗暴, 语音识别是用的手机某厂的语音识别 sdk 的 Demo 改的 lol, 所以相当于有 3 个端, 云端, app, 电脑. 除了识别准确率之外, 反应速度也不满意, 操作之间需要停顿. 如果真要用的爽, 要把三端合一, 并且 1 中的中间层定义的要简短.

DOLLOR

2018-05-18 13:54:35 +08:00

能引起革命的不是语音，而是脑电波

hellobanny

2018-05-18 13:58:39 +08:00

本来只有腰酸手痛，现在还要加上嗓子哑了。

lanjz

2018-05-18 14:06:44 +08:00

@artvista 哈哈哈哈

it1989

2018-05-18 14:48:04 +08:00

通过意念写代码可否实现？
认真问！

gfh110

2018-05-18 14:52:03 +08:00

用易语言的 AST 就可以了。或者 Lisp 方言

SuperMild

2018-05-18 15:20:03 +08:00

@simpleliang 这个倒是有一个笨方法解决，就是有一个设置过程，初次使用时引导用户把语音命令念一遍，同时演示效果。这样做还有个好处，用户可以趁此机会自定义命令，因此不受语言影响，不管说英语、普通话还是粤语，反正就以用户念的为准。

由于是一种全新的交互模式，第一次使用时有互动教程应该不会引起用户反感。

tnter

2018-05-18 15:22:34 +08:00

带动了嗓子药产业的发展 /dog

hangzhoupm

2018-05-18 15:31:37 +08:00

说的更不上思维的速度，效率会有很大的影响

murmur

2018-05-18 15:36:06 +08:00

@SuperMild

格式化
格式化
cnm 让你格式化啊
哎你 sb 么我让你把代码格式化没让你把 d 盘格了

大概场景就是这样吧

Admstor

2018-05-18 16:28:49 +08:00

@mcluyu
那也依然不需要语音编程
你说的第一点就实际上是 UML->代码,已经有一些工具可以帮助实现,自动编程这个领域也在做类似的发展
第二点,图形这一块也显然是鼠标键盘甚至触摸的效率更高,也与语音毫无关系

语音仅仅是为一些障碍人士使用的辅助工具,试图代替主流工具目前看不到任何可能性

simpleliang

2018-05-18 17:26:09 +08:00

@SuperMild 恩也是一个很好的方案, 但是优缺点很明显

优点是: 提高的识别准确性, 但前提是没有相似的语音命令, 再前提是命令比较少且结构简单

缺点是: 如果有组合命令, 或命令很多, 那么准确性还是一样会打折扣; 给每个命令设置语音有点像设置快捷键, 如果命令很多, 这个过程还是比较磨人的

SNOOPY963

2018-05-18 17:41:28 +08:00

- - 感觉人和人直接把我重点的能力真的差太多。

理论上可以。甚至能到非常可用的程度。

上面说 PM 这么编程不厚道，PM 也是帮你们梳理过的，应该说老板（需求方）才是这么做的。

无非是，目前机器智能程度，还不足以自己定义某一个东西。要做到理想的程度，起码还需要一两个技术突破。
这个时间上是不确切的。

Symo

2018-05-18 17:43:11 +08:00

其实是有的, 盲人程序员.
确实比普通程序员编码速度更慢一些, 但是通过语音输入可以完成

QK8wAUi0yXBY1pT7

2018-05-18 17:52:31 +08:00

目前用眼睛写代码也许更容易实现一点，而且不打扰别人

Yycreater

2018-05-18 18:30:27 +08:00

@artvista 丫的，画面感～真强！服了！！～

pandaaa

2018-05-18 19:07:54 +08:00

@artvista 你要笑死我继承我的橘子吗？

Shawn5

2018-05-18 19:15:02 +08:00

可以想象在一个办公室，大家一起用语音编码的场景，估计直逼菜市场吧，哈哈啊哈哈哈哈啊哈哈

param

2018-05-19 01:30:50 +08:00

我觉得，只要设计一门专用于语音编程的语言也未必不行。通常文字都是基于语言的。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/455738

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.