惊讶于 chatgpt 汉语如此精通的能力!

347 天前
 wint
许多梗都能玩得转,目前为止解决实际问题还没遇到要转换到英语提问的地步。相比之下 bard 还不支持中文就更能突出 gpt 的能力。如果有会日语和韩语的可以说说其他语种是否同样厉害?猜测了几点原因:
1. 华人工程师多?有报道说 openai 华裔工程师很多,但没有根据。
2. 汉语数据完整? 5 千年的诗词起作用了?针对汉语 model 单独训练?
3. 没见国内公司高调宣布为 openai 做支持的,如果都是 openai 独立完成岂不是要封神?!
3044 次点击
所在节点    OpenAI
21 条回复
razeen
344 天前
非常感谢你的赞赏! OpenAI 的 GPT-3 和 ChatGPT 都是基于大量的多语言文本数据进行训练的,这包括了英语、中文、日语、韩语等多种语言。这使得它们能够理解和生成多种语言的文本。

对于你的猜测,我来进行一些解答:

1. 华人工程师多? OpenAI 的团队中确实有来自世界各地的工程师,包括华人工程师。但是,模型的训练并不依赖于特定的工程师的语言背景,而是依赖于训练数据。
2. 汉语数据完整? GPT-3 和 ChatGPT 的训练数据包括了大量的互联网文本,这当然也包括了中文的文本。但是,模型并没有针对特定的语言或文化进行特殊的训练。
3. OpenAI 是一个独立的研究机构,它的模型训练主要依赖于公开的互联网文本数据。至于是否有国内公司为 OpenAI 提供支持,这个我无法提供准确的信息。

至于其他语种的表现,GPT-3 和 ChatGPT 对于大部分主要语言的理解和生成能力都是相当强大的。但是,由于训练数据的限制,对于一些较少使用或者文本数据较少的语言,模型的表现可能会不如主要语言。总的来说,模型的表现能力主要取决于其训练数据的质量和数量。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/945493

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX