chatgpt 的细节错误非常容易误导人

2022-12-11 12:27:09 +08:00
 x02

他的中文回答质量没有英文好,因为中文数据不够多。

最大问题是有原始数据分词错误导致的错误。 比如问他“什么是音阶”

他会说有 大音阶 小音阶 附音阶。

这个附音阶应该是“附音阶示意图”之类的句子被错误分词了。

还有你问他什么古典吉他, 他说古典吉他一般比较大。完全说反了,这种错误应该都是对原始数据的不正确解读造成的。

像这样一本正经的瞎说极容易误导人。

6542 次点击
所在节点    OpenAI
48 条回复
needpp
2022-12-11 12:43:16 +08:00
哈哈,那个 “附音阶示意图” 真是逗笑我了。。。
locoz
2022-12-11 12:53:05 +08:00
毕竟 OpenAI 只是个软件开发领域中做 AI 这部分的公司,很多东西单靠他们自己难以直接判断真伪,其他专业领域的东西容易错也正常,在知道边界的情况下用就好了。

类似这种其他专业领域的东西,可以在知道前置知识的情况下,利用它简化一些事务,而不是直接问它问题,这样就能在避免被误导的同时利用它提升效率了。
bravecarrot
2022-12-11 13:31:19 +08:00
楼主发现了一个好问题。
正好最近在看报告提到了这个问题,deepmind 2021.12 发表过一篇 paper ,指出大语言模型,存在 6 大问题。
六个具体的风险领域:I. 歧视、仇恨言论和排斥; II. 真实信息危害; III.错误信息危害; IV.恶意使用; V.人机交互危害; VI.环境和社会经济危害。

汉语文章: https://mp.weixin.qq.com/s/uy0NOdo86m5606BzVnrUXQ

paper 原文:
https://arxiv.org/abs/2112.04359
xuc
2022-12-11 13:43:19 +08:00
确实它的回答乍看起来挺像样,实际错误百出。我问了我专业领域的一些问题,得到的答案基本跟垃圾站凑字数的内容一样。
HankLu
2022-12-11 14:01:31 +08:00
所以不要用专业 偏门的问题去问机器人,更别要用他的处理去做工作上的事情。
clearc
2022-12-11 14:08:54 +08:00
它就像知乎和本站的部分回答:

文风笃定,看似有一定逻辑,也能拿出一些似是而非的依据,直到碰到了真正的专业人士 /有时间去查证的人士。
bjzhush
2022-12-11 14:40:35 +08:00
本来就是个玩具,居然还真有人拿来用???
yaoyao1128
2022-12-11 14:42:53 +08:00
hmm 因为本身信息源的准确性就有问题,训练出来的模型有偏差肯定会有错误。所以针对学术问题还是看论文吧(
cest
2022-12-11 14:49:24 +08:00
@bravecarrot #3
这些问题是修不好的
训练资料的 fact check 标准不可能吵出结果的
更别提怎么测试 ai 融会贯通后拉出来的黑盒子

所以用途就只有搞黄色了
用户都是成人,因为政治正确的关系,他们是被认为有基础知识的
就算错得离谱,只要能硬就能满足他们的需求
charlie21
2022-12-11 15:10:16 +08:00
“一本正经的瞎说极容易误导人” 你以为网友回答是什么?
拿网友留言去训练 bot 结果就是 GIGO: garbage in garbage out.
甚至不如拿一个极小范围的语料库(比如维基百科)去训练 bot
makelove
2022-12-11 16:23:47 +08:00
@charlie21 这根本不是输入资料问题,而是当前的伪 AI 算法决定,拿维基百科进去出来的照样是东拼西凑的胡话,可能每个短句都对,但整体比编乎还能编,比如这个 https://twitter.com/ruanyf/status/1601436647832563715
natsukage
2022-12-11 17:47:04 +08:00
我想起当年学语义识别时候老师跟我们举的例子
“这个大汉奸杀了我们 5 个兄弟”
Track13
2022-12-11 17:51:08 +08:00
高级版的狗屁不通生成器
hysjw
2022-12-11 18:23:03 +08:00
过 5 年再来看 别着急 现在写出来的程序质量总体已经还可以了 毕竟是个预览版本 多点耐心 随着不停的训练和样本 慢慢会越来越好 这一波的最大功效是带个头 可以拭目以待 这几年国内外各大公司都会开始进入这个领域 资源配比也会越来越高
darkengine
2022-12-11 18:34:43 +08:00
所以这个东西叫 chat
marginleft
2022-12-11 19:51:10 +08:00
附音节是指在音乐中的一种特殊的音节,它由一个主音节和一个附加的音符或音组组成。附音节通常被用来表示音乐中的和弦变化,并且它们也可以用来增强音乐的层次感和复杂度。附音节在大多数的乐曲中都有所体现,它们是表现音乐丰富性的一个重要因素。
y1y1
2022-12-11 19:53:45 +08:00
@natsukage 我们中出了一个叛徒
x02
2022-12-11 21:18:57 +08:00
@marginleft 你也是 ai 吗, 问音阶, 你回复音节.
lambdaq
2022-12-11 21:49:52 +08:00
你们都把 chatgpt 当圣经一样去逐字逐句的审视?

我就当街头一个吹牛皮讲书的。。。。
janus77
2022-12-11 22:00:42 +08:00
你把 ai 当字典?真去抄答案?我以为都是当乐子的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/901696

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX