看西部世界的一个想法,如果实现一个简单版需要哪些技术栈?

2018-06-25 09:36:12 +08:00
 wensonsmith
《西部世界》 第二季中,Robert 说西部世界的不是在开发 host, 而是在解码 Guest。

之前也有过这个想法,就是把我能记住的所有信息录到一个系统,然后别人问这个系统的时候,我可以给出回答。

比如我什么时候出生,父母兄弟是谁,小时候的一些事情等等。

当然并不是达到人工智能那个水平,就是一个简单的问答。 可以理解为个人定制版的 Siri。

现在可以想到会用到的技术有:

1. 语音识别,语音合成
2. 分词
3. 知识存储检索
4. 模糊查询


还需要哪些?

有没有类似的开源系统可以借鉴,或者思路?
6091 次点击
所在节点    奇思妙想
41 条回复
herozhang
2018-06-25 15:25:14 +08:00
研究出来做啥?
为啥不直接研究纯电子化意识,还要肉体做啥??
肉体这种低端形态完全不适应未来的星辰大海啊
mayne95
2018-06-25 15:48:55 +08:00
对这类话题比较感兴趣,再啰嗦两句 233

楼主其实已经把技术列的差不多了,如果要做个人助手的话,我结合我所知道的可用技术,梳理一下流程。

首先是语音输入和识别的问题,推荐这个平台 https://dialogflow.com/ 以前叫 api.ai 后来被 google 收购改名了。现在整合了各大平台接口,可以非常方便的开发语音助手。只要有个手机 app,来提供语音输入输出就行了。后面的逻辑处理你可以自己实现。

这个平台提供了,分词和归纳的功能。比如你问,今天北京的天气怎么样。 分词后"北京"会被归纳到 地点类型,当成一个属性。然后你调用自己接口处理的时候,可以把这些信息都传进去。

语音助手的实质是对话,对话的基础是理解上下文。比如上面的问天气,如果不知道地点,回答起来是牛头不对马嘴的。分词之后,北京作为一个地点属性,存储在上下文中,当前对话的地点就是北京。

你也可以自定义属性,或者为属性添加词条,比如为"地点"添加一个不知名的小地名。

楼主提到技术 1&2,已经有成熟的解决方案了,不用自己再造轮子了。

技术 3&4,楼主或许可以结合你附言中提到的那个东西吧,我不怎么了解。

关于数据存储,因为没有像西部世界里面那种高科技的帽子,数据的录入只能依赖于日常生活中的积累。

我觉得可以这样搞,如果是 社交网络癌的话,现有的数据已经很多了,其中少部分包含对待某事物的情感。可以想办法导出来,算是情感类的数据吧。

可以用 IFTTT,记录社交活动,自己存储起来,用作日后的数据分析。比如有个推是骂 xxx 的,然后你点了赞,通过感情词汇的分析,就可以得到你对 xxx 的态度,然后存储起来。

这个时候你有了人名:xxx,态度:讨厌。再到后面你问助手,我对 xxx 的看法时候,检索对应的信息就 ok 了。

知识类的数据,因为已经有一部分公共的知识(维基百科等)了,这些接口很多就不列举了。 真正自己产出的知识,我 倾向于建立自己的知识库。因为这是你自己真正有特色的东西。如果已经有写 blog 的习惯了,有观点输出,这部分的数据也就有了。如果没有的话,你要自己考虑一下你的知识库该怎么建。个人推荐 notion,现在出了表格真的很好用。
lyz745704689
2018-06-25 16:01:59 +08:00
@ijse 那没死之前,这个网站有卵用呢...
onbeam
2018-06-25 16:57:56 +08:00
将自己的意识上传。然后脱离躯体,做一个网络幽灵。
luoway
2018-06-25 17:49:36 +08:00
@onbeam 意识是什么都不知道,就开始科幻意识上传了。
saulshao
2018-06-25 19:57:43 +08:00
我一直有一个梦想,就是在我死之前能实现一个智能程序,模仿我活在互联网上,即使不能和人见面,玩玩 facebook 也是好的。
civet
2018-06-25 20:41:30 +08:00
AIML
elvodn
2018-06-25 20:51:30 +08:00
Amadeus
onbeam
2018-06-25 21:03:44 +08:00
@luoway 思维意识应该算是一种脑电波,最后应该还是可以被数字化。
GTim
2018-06-25 22:08:08 +08:00
@saulshao

我最近在调教我的天猫精灵,就是类似这样的,不过好难,识别率好低

最坑的一点,就是他完全没法理解,我小时候的故事,我与外婆的故事

我小时候的故事,就三个关键点:我 小时候 故事
我与外婆的故事: 我 外婆 故事

我 需要生物信息识别

小时候,需要年龄界定

外婆是参与者

所以,其实就是什么人在什么地方什么时候与其它什么人怎样做了一件什么事

不过这种实现起来还好,但如果要在网上留下印记,那还是太难了..
inflationaaron
2018-06-25 22:32:08 +08:00
要实现这样的玩意很明显就涉及到人工智能了。因为不是所有的输入都是规范性的,因此这个系统不仅需要明白每一个字说得是什么,更需要理解词语之间的联系和指代关系。这就进入 NLP 的领域了。如果你不要这种界面,那搜索引擎已经完成了剩下的工作。
cqhme
2018-06-26 04:32:56 +08:00
莫名想起了 浣熊市的“红皇后”
and
终结者里的 skynet
😂
cqhme
2018-06-26 04:34:40 +08:00
@mlhorizon 嗯 圣朱尼佩洛 这集有点暖
luoway
2018-06-26 11:22:17 +08:00
@onbeam 脑电波是电波,是媒介不是产生源,是被观察的现象不是现象起因,是信息不是信息源。
意识从来未来都不是脑电波。
monimonipo
2018-06-26 16:26:18 +08:00
@onbeam 脑电波应该是属于意识的副产品,意识本质应该是各种生物电化学反应以及构成反应的物质。
geying
2018-06-27 10:32:46 +08:00
@onbeam 超级骇客?
taurenshaman
2018-06-29 16:56:45 +08:00
只要不是把各种规则进行硬编码,就涉及到知识的定义、构建。

这个大概就属于 [知识系统] 的符号学派了,可与参考:
楚辞: http://www.chuci.info

知识系统还有很多其它学派。最有名的可能就是 Alpha GO 为代表的产品

https://www.leiphone.com/news/201712/etoCoUwMbaYaIpKI.html
PerFectTime
2018-06-30 11:05:40 +08:00
歪个楼,那如果有两份数据一样的“你”,都认为自己是真的“你”,另外一个“你”是假的呢
a174871
2023-03-29 14:40:25 +08:00
请问 Mathematica 是指什么呢,我搜索了一下是个数学方面的软件?
wensonsmith
2023-03-29 18:18:53 +08:00
@a174871 #39 https://www.wolfram.com/mathematica/

对的,就是这个东西。这个东西对真实世界进行建模

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/465544

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX