有个问题我始终没有弄明白,如 claude 这样的模型,中国大陆 IP 不能访问

3 小时 17 分钟前
 intoext

那他为啥对中文支持还挺好,而且中文的回答并不比国内模型差呢?

既然不让中国人用(甚至港澳 IP 也用不了),为何搞简体中文版本?

难道是为了海外华人特别是还用简中的人使用的吗? 那才有多少人啊,数量级也就百八十万吧。

还是说这 AI ,在训练或推理时,对于多一种语言支持,其实并不费什么事儿?

还有就是到底是中国想用而不得,还是 GFW 也墙了 claude ,这个有懂的吗

3090 次点击
所在节点    Claude
46 条回复
ntdll
2 小时 43 分钟前
以我浅薄的基础,LLM 对于语言的支持并不困难,主要还是在 Tokenization 阶段,训练阶段语料少的语种需要更多的 token 才能达到相同的效果。
ndxxx
2 小时 39 分钟前
@ndxxx 既然楼主号称自己不是在装糊涂,那么我就稍微认真的回答一下。简单来说就是机器/AI 翻译的能力或者说模型的能力进化了:

1. 早期的统计机器翻译和早期神经机器翻译,很多时候是按语言对训练的:A 语言 ->B 语言; B 语言 -> C 语言; A 语言 -> C 语言。此时如果没有足够的“泰语 ->冰岛语”双语平行语料,那么就会引入 pivot language:泰语 -> 英语(pivot) -> 冰岛语

2. 现代 LLM 早已不需要显式 pivot ,是因为它不是简单的 A 语言词句映射到 B 语言词句,而是在一个统一模型里学到了很多语言和知识之间的关联。这个“跨语言迁移”的能力,底层机制就是常说的共享语意空间 shared semantic space 。
JiMuChan
2 小时 14 分钟前
盲道、无障碍设施根本就没几个人用,干嘛还要建设呢
ixcode
2 小时 13 分钟前
因为大(语言)模型最擅长的就是搞语言,不管是中文英文这样的自然语言,还是 java python 这样的编程语言,都是 LLM 最擅长的内容,也是对翻译和编程这两个领域带来最大的革命性的原因
XenoGear
2 小时 10 分钟前
谷歌有全世界的数据,中文语料实际上比中国绝大多数团队都强,而且真洗数据不会分那么细的,到底洗不洗某个语言的数据,尤其网页数据很多就是中英混杂的
jonty
2 小时 6 分钟前
你先明确一下,他们实际上不是针对中国人,是针对中国地区...
94
2 小时 0 分钟前
@intoext #11 ,那就从你这个角度出发延展。虽然 A\ 有点魔怔,但也只是因为当前政治环境下 PRC 是对立面。可以理解为是“敌意”,并不是“歧视”。如果政治环境变化了就不一定还是对立面了。
dyvdy
1 小时 55 分钟前
非中国大陆,会讲中文的华人应该就有 5000 万以上,台湾 2300 万,香港 700 万,马来西亚 700 万,新加坡 300 万,美国 300 万+,再加上其他国家零零散散的移民,市场已经挺大了吧…
ndxxx
1 小时 50 分钟前
@dyvdy 美国人中心主义是认为文明国家人人都会讲美式英语😁

中国人中心主义是世界上只有中国使用简体中文😁
lmmlwen
1 小时 49 分钟前
可以看看 Anthropic 首席科学家的采访,对中国或者“共产主义”的看法
docx
1 小时 48 分钟前
Cladue 本来就没支持中文,你可以去 web 设置里看有哪些语言。至于语料是中文,这是另外一回事。
urlk
1 小时 47 分钟前
claude api 文档是有中文的, 反观 OpenAI 的却没有
zzutmebwd
1 小时 38 分钟前
Anthropic ( Claude 开发团队)的核心技术与研究团队中,华人或华裔比例大约在 16.4% 至 20% 之间。
Bad0Guy
1 小时 33 分钟前
@intoext #11 论歧视而言 A\真不如早期的 OpenAI ,+86 不能注册并且必须要你验证手机号不,plus 还不允许国内卡支付,A\刚推出那会儿都不会强制要你验证手机号。从一开始这两家跟国内就是双向墙。
Bad0Guy
1 小时 32 分钟前
@Bad0Guy “号”后面的“不”多打了
deplives
1 小时 28 分钟前
你搞混了一个概念
中文不是中国人的专属,A 社只是不想让中国大陆地区使用,而不是中文使用者使用
你就是英语母语者,在中国的环境下 A 社同样不欢迎使用
aogu555
1 小时 2 分钟前
马来西亚+新加坡也有 1000 万用简体中文的华人啊,然后还有繁中的几千万,这中文用户也不少啊
ykrank
1 小时 2 分钟前
@bzkmsjy 这才是市场经济
ykrank
52 分钟前
@deplives 香港也不行
TimPeake
47 分钟前
楼主 你知道一个事情吗?大概就是,前段时间,他们的一个 CEO 发表了言论,大致意思是,卖给中国显卡发展 AI , 跟卖核武器跟朝鲜差不多。作为一个盈利目的的私企,这态度,只要是个正常人,都能看出来,是有点主观反华的意味的,根本就不是普通的配合政府法规要求。
国内环境:“爹 您 claude 能卖我会员吗” anthropic: 滚!捞汁就是不卖!偷摸也不行!逮一个封一个!

我不是想故意制造对立渲染什么爱国情绪,作为消费者不要这么卑微,替代品又不是断崖式领先。实在不行用 copilot codex 之类的都行啊

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1214381

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX