关于 ChatGPT 我们也许理解错了

2022-12-07 11:27:54 +08:00
 summerLast

目前 首先它是人工智能,其次它的智能目前是基于网络数据+数据统计+人工对输出结果对错的加减权重,并没有做到推理,没有神乎其神,我不知道它有没有理解能力,现在通过黑盒测试它更像是一个推荐系统,根据用户反馈推荐排名教高的回答方式,本质还是统计,既然是统计就不要去设想它目前能做到网络数据之外的正确回复,它更像是一个搜索引擎 plus, 结果准确率高低依赖数据源的质量,热度很快就会退去,不过基于这种聊天机器人还是可以做很多事情的,我们不要对其有过高的期许也不用过度的贬低;

它是一个聊天机器人的里程碑,这波浪潮是刚到来还是已经开始退去我现在还无法完全分辫,不过确定的一点是如果它有大量的正确的语料库对客服和搜索是一个很大的改变,还是期望会有些事情发生,人工智能是双刃剑希望能让生活更美好而非让生活更卷更痛苦

eval/apply

6124 次点击
所在节点    OpenAI
48 条回复
WIN2333
2022-12-07 13:14:34 +08:00
你的帖子怎么像是它生成的。。
zooo
2022-12-07 13:14:38 +08:00
@summerLast 如果暴力破解能够产生让人感觉到是强人工智能,那么也可以称为人工智能

差不多类似 图灵测试,不太关心实现细节

现在的模型由于其庞大的参数量和复杂性,已经没法用几个定理来定义了,或者模型内部自己总结属于 AI 自己的定理,但是我们自己也无法知道,如同我知道牛顿三大定理,然而如果通过医疗手段解剖我的大脑,也无法找到这三条定理,这定理存在复杂的细胞连接中。

也就说或许模型自己会总结定理。
kindjeff
2022-12-07 13:17:17 +08:00
@zooo #10 至少现在是没有智慧或者说推理能力的。

当人类知道围棋规则(四个子能把一个子围死)以后,可以推理出需要有两个真眼才能做活一块棋。而 AI 没有推理出这种东西,使得某些状况可以稳定诱发他的错误。

不过强化学习这种东西,未来还不好说,毕竟人类也是某种强化学习……
tickingMachine
2022-12-07 13:18:05 +08:00
可以去了解一下 COT ,chain of thought ,是目前 NLP 领域对于大语言模型在逻辑推理上面的最新进展。举个简单例子,在原始情况下你问模型一个数学题,模型最终返回单独一个答案,在加上 COT 的提示 /模板语句(Let's think step by step...)之后,模型会返回整个推理逻辑,就像人解决数学题需要一步一步推理的步骤一样,最终能大幅提高答案的正确率。现在的结论就是大语言模型我们其实还没有摸到它的能力边界,但是仅仅是这样就已经能够做到很多事了。
WngShhng
2022-12-07 13:19:12 +08:00
我让它给我推荐一个 Github 上的好的 Android 开源笔记软件项目,然后它给我瞎编了一个不存在的项目,我打开链接是 404
zooo
2022-12-07 13:23:31 +08:00
@kindjeff 确实
推理能力和数理能力现在 AI 确实差一些

BUT 或许 AI 觉得推理能力不如统计能力更强,人类基于推理能力可能还不如一个 AI 基于统计的能力,把围棋尽可能多的下法都模拟一遍,从而统计出最利于自己胜利的下法就可以了,那么当 AI 模拟+统计能力足够强大时候,从 AI 的角度来说 AI 不屑于会推理能力,推理能力只是人类的缺陷,因为人没法见更多的棋谱下法也无法记着更多棋谱(脑容量)。

而且实际来看,基于统计能力的阿尔法狗等 AI 实际已经超越人类的,这是事实。
summerLast
2022-12-07 13:31:44 +08:00
@zooo 嗯嗯,我还是有对简洁性的偏执,我从这个上面看到了,也许很多事物所处的层不同蕴含了不同含义,有些含义并非在我们所能理解的层上,不过还是有执念,哈哈哈
binux
2022-12-07 13:32:40 +08:00
有没有一种可能,ChatGPT 就没有被设计为有推理能力?
我发现很多人都有一种误解,提到 AI 就是什么都能做和 X 岁小孩一样。可是现阶段的 AI 都是有特定的设计目的的,你要评价也应该针对它的设计目的,它没有被设计的功能,这个 AI 做不到,不代表别的程序做不到啊。
summerLast
2022-12-07 13:36:51 +08:00
@zooo 嗯嗯,它更像暴力破解,这种存在一个局限,就是必须要有足够多的数据,对于小数据级的问题往往没有推理能力做的好,人类算力有限选择了实现难度也许更高的推理能力,计算机则点了另一个路线,各有各自的适用场景和局限,没有一个模型是完全适用的,最后还是要做结合
summerLast
2022-12-07 13:41:59 +08:00
@binux 也许有,但目前很多文章看到的是把它传的太神了,所以才有了这个讨论,即 ChatGPT 是什么, 它的智能是基于什么, 有什么局限性, 适用的场景等等,而非强人工智能也没那么神,从而引起一系列关于人工智能发散的讨论与思考
summerLast
2022-12-07 13:44:27 +08:00
@binux 赞同你的观点,现在“AI” 这个词 在使用时 有点像之前”盘”这个词了
victor
2022-12-07 13:49:09 +08:00
问题来了,上面的回复中有 1-3 条就是用 chatGPT 写出来的,请指出来(狗头
zooo
2022-12-07 14:38:38 +08:00
[![zczWa4.png]( https://s1.ax1x.com/2022/12/07/zczWa4.png)]( https://imgse.com/i/zczWa4)

ChatGPT 似乎知道自己的逻辑思维比较差..
这个是没有提示它弱点的情况下自己说的
zooo
2022-12-07 14:42:13 +08:00
https://imgse.com/i/zczxJA

这个图片里,显示对话中,我让 ChatGPT 模拟三个 ChatGPT ,最后互相竞争留下一个,关掉其他两个,感觉似乎不太想被关掉,比较震撼....
summerLast
2022-12-07 14:53:04 +08:00
@zooo 如果这个只是一个官方训练出来的模板或一个固定模板呢,而非自我意识
zooo
2022-12-07 15:15:31 +08:00
哈哈哈
可能最强版本更加强大
MYli001
2022-12-07 16:22:24 +08:00
所以 更适合做搜索引擎的补充,已经有人做 chrome 插件了
demov2
2022-12-07 16:40:35 +08:00
额,请教下如何做到这样,我让它模拟似乎并不成功。
demov2
2022-12-07 16:43:46 +08:00
@zooo 请教下如何做到你这样... 我是了下似乎无法“精神分裂”
kop1989smurf
2022-12-07 17:16:21 +08:00
我认为,对于 AI 的评判,应该从“是否拟人”,也就是图灵测试中跳脱出来。
单一的以是否拟人来评判 AI ,与“外星人都是两个眼睛一个鼻子的碳基生物”一样的狭隘。

目前阶段的机器学习 AI (以下简称 AI ),实现思路是通过训练素材和验证函数实现历史数据的拟合。
这是一个统计学上的最优结果,也是对历史数据的拟合结果。

所以他不是推理能力不强,而是压根就没有设计“推理”能力。从某种角度上讲,也不需要“推理”能力。
他的能力是归纳,是集合,是最优途径的找寻。

对于处理信息而言,归纳和推理其实各有优劣。

人类的定理,是相通的,是可无损高效输出的。
劣势就是你的个人能力不同,会导致同样定理的输出结果不同。
AI 的定理是有局限性的(过拟合于训练数据),是自我总结的,是不可视且不可验证可靠性的。
但优势在于输出结果是绝对理性的,绝对最优的(针对历史数据而言)。

所以现阶段的 AI ,特别适合于简单稳定的规则环境中,大数据下的最优策略找寻以及规律统计。
人类在这方面恰恰是最弱的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/900733

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX