惊讶于 chatgpt 汉语如此精通的能力!

2023-06-03 16:13:30 +08:00
 wint
许多梗都能玩得转,目前为止解决实际问题还没遇到要转换到英语提问的地步。相比之下 bard 还不支持中文就更能突出 gpt 的能力。如果有会日语和韩语的可以说说其他语种是否同样厉害?猜测了几点原因:
1. 华人工程师多?有报道说 openai 华裔工程师很多,但没有根据。
2. 汉语数据完整? 5 千年的诗词起作用了?针对汉语 model 单独训练?
3. 没见国内公司高调宣布为 openai 做支持的,如果都是 openai 独立完成岂不是要封神?!
3057 次点击
所在节点    OpenAI
21 条回复
pepsiwant
2023-06-03 16:14:35 +08:00
我可以很负责任的说,比起英文,汉语能力差了一大截
linearxian
2023-06-03 16:21:32 +08:00
能把题目写通顺了吗
LaurelHarmon
2023-06-03 16:26:48 +08:00
bard 垃圾极了,别说中文了,就算用英文,保持对话上下文语义连贯都做不到。真不知谷歌这几个月做了个啥玩意。
还加了一个“google it”的按钮,妄图给搜索导流,抱缺守残,这样下去,只会和 GPT 差距越拉越大。
snw
2023-06-03 16:28:58 +08:00
语言模型嘛,语料训练得多了,说话就熟练。
平时人们说话写文章大多是有套路和思维习惯的,越练越熟,你看外向的人越说越会说,不动脑子就能滔滔不绝;内向的人总是想不出该说些什么,一张口又常常说出病句,越不说越不熟
hsfzxjy
2023-06-03 16:34:25 +08:00
“惊讶于 chatgpt 如此精通汉语”
“惊讶于 chatgpt 如此强的汉语能力”

感觉 chatgpt 的汉语能力确实比楼主强不少😂
ispinfx
2023-06-03 16:35:21 +08:00
喂了约等于整个互联网的数据,你说呢?
wint
2023-06-03 16:38:16 +08:00
@snw 我觉得数量不是关键,质量才是关键。你用百度搜出来的东西能看吗,目前热门的自媒体、头条质量都不敢恭维。但 gpt 中文问答质量很高,明显人为监督提供了高质量语料。与此相对,以百度的搜索质量他的 ai 质量可想而知。
wint
2023-06-03 16:41:03 +08:00
@ispinfx 光论数据量 Google 独一档,但 bard 争气吗?
zictos
2023-06-03 17:38:35 +08:00
反正我觉得它能用中文回答很多英文互联网才有的内容,很多东西在中文互联网根本没有任何信息,它照样能回答得很好。这意味着不需要去谷歌搜索英文,在 chatgpt 用中文提问就能获取到很多英文互联网才有的信息
xmlf
2023-06-03 18:26:56 +08:00
很多古文用 chatgpt 可以很完美的翻译出来
luckyjoe
2023-06-03 19:14:33 +08:00
peter deng ,vp of consumer product openai 刚上任的,是华裔 但是好像不懂中文
ispinfx
2023-06-03 19:37:23 +08:00
@wint #8 我说的是是个人说过的话它都见过了,没什么值得惊叹,并不是说“有了很多数据就能训练一个很屌的模型”。
jack4536251
2023-06-03 19:48:47 +08:00
因为开发这个产品的程序员基本都是国内润出去的中国人
RoccoShi
2023-06-03 20:56:34 +08:00
说明咱们人多
IDAEngine
2023-06-03 21:02:08 +08:00
@wint 很多都不知道是几代华裔了,从清朝就过来了
hanqian
2023-06-03 21:09:36 +08:00
楼主用的应该是 gpt4 吧,我记得 openai 说 gpt4 的中文能力比 gpt3.5 的英文能力还高
fds
2023-06-03 21:40:36 +08:00
学语言对我们人类来说,并不是最难的事情,对吧?从小学到中学,我们就已经基本学会了。而且,语言为了让大家更容易学,也尽量简化了一些难度。不过,GPT-4 不仅仅是擅长语言这么简单,它在逻辑推理和分析方面可是厉害得多呢!这正好说明,GPT-4 的能力已经超过了我们通常理解的“掌握语言”。当然啦,作为一种人工智能,GPT-4 还有很多可以进步的地方,但它确实在很多方面都做得相当不错!

不过上面这段 GPT-4 的发言还是不够自然,我已经让他尽量口语化了。 之前的回答更是一眼 GPT 生成。
Ocean810975
2023-06-04 09:53:41 +08:00
从语言学上讲,各种语言上并不是完全孤立的,所以即使是印欧语系的数据也有助于汉藏语系的训练。
wint
2023-06-04 19:57:25 +08:00
@hanqian 基本是 bing chat 的体验。
wint
2023-06-04 19:58:14 +08:00
@fds 🐮,读出来没,整段整段的傲娇😄

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/945493

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX