文心一言测试

2023-03-17 22:34:38 +08:00
 waler

https://imgur.com/a/RGIYzpK

4100 次点击
所在节点    分享发现
30 条回复
waler
2023-03-17 22:38:04 +08:00
rimutuyuan
2023-03-17 23:59:34 +08:00
其实还不错,稳步更新中
stabc
2023-03-18 00:37:27 +08:00
它只是把百家号的自动生成工具拿出来了。百家号是啥德行大家都知道。
tool2d
2023-03-18 00:42:01 +08:00
一问一答这种只要训练集足够大,总能模糊匹配出一些看起来还可以的答案,拉不来明显差距。

ChatGPT 惊艳的地方,不是回答问题的能力,而是分析问题的能力。

能理解你语境和语句的内涵,这才是 AI 的魅力所在。
misslita
2023-03-18 00:49:33 +08:00
多轮对话很弱没有记忆一样,就是一问一答其他模型也能做到,代码能力约等于没有,比较强的可能就是对于一些中文的理解,其实把生成图片和语音缝合进来很尬
nomagick
2023-03-18 00:50:24 +08:00
要知道 ChatGPT 刷新认知之后,对大模型的期望更多是战略层面上的,要能自动化进行情报收集分析和整理,辅助政策制定,要能模拟选民或者受众行为,还要能应用到军事,辅助战场指挥。最后是融入各行各业,具体推动社会发展。

在民用领域聊几个闲天,这功能有没有,谁提供,无所谓。
Elix
2023-03-18 01:22:34 +08:00
lhbc
2023-03-18 07:36:28 +08:00
第一个其实是 Java 工程师的要求,几个框架全是 Java 的

那个邮箱正则错了几个地方:
用户名漏了 _
域名是可以单个字母数字的,它限制了至少两个
多了个空格
lhbc
2023-03-18 07:38:04 +08:00
@tool2d 完全赞同。
需要设计一些精妙的问题来测试 AI 这方面的能力
lhbc
2023-03-18 07:38:54 +08:00
@Elix 不要问天气了,天气这种级别的问 siri 小爱就行
lhbc
2023-03-18 07:40:27 +08:00
粗略地说,超出我预期了
liuguangxuan
2023-03-18 08:17:09 +08:00
@lhbc 你只看到了他问天气,没看到他的 02.29
lhbc
2023-03-18 08:26:52 +08:00
@liuguangxuan 没有意义。
你确定文心一言会即时联网或者训练数据包括了天气数据并且语料时间在 2 月 29 号之后吗?
cat333
2023-03-18 08:27:02 +08:00
脑筋急转弯还是不行
lhbc
2023-03-18 08:28:53 +08:00
@liuguangxuan 也不用测试它是否会判断闰年之类,AI 不是这样检索问题的
joy33
2023-03-18 08:29:55 +08:00
@cat333 #14 哈哈,有待加强,起码说明不是照搬 openai 、有思考性
lhbc
2023-03-18 08:30:24 +08:00
低级问题只能 garbage in garbage out
Elix
2023-03-18 11:35:17 +08:00
@lhbc 不是我问的,你仔细看看图。
Elix
2023-03-18 11:36:46 +08:00
@lhbc 请问 2023 年的 2 月有 29 日么?还是说文心一言用玛雅历?
LightOrange
2023-03-18 12:35:54 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/924973

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX