我尝试用了科大讯飞的星火模型,感觉国内的 Chatgpt 要崛起了!

355 天前
 miv

使用体验:

  1. 问答效果流畅
  2. 和 GPT 一样,也是离线访问的
  3. 讯飞的有时候有点头铁,问问题没有 GPT 那种胡诌的感觉
  4. 写代码能力感觉还行,很强
  5. 其他交给 v 友补充
14602 次点击
所在节点    OpenAI
136 条回复
xdygxh
355 天前
你问:已知 2+1=3 ,那么 3-1 等于几?
Bijiabo
355 天前
能体现出社会主义核心价值观不?
helooo
355 天前
无所谓了,在我最需要帮助的时候,是 Chatgpt 出现了
RiverMud
355 天前
@xdygxh
已知 2+1=3,那么 3−1 等于几?
我们可以设 x 为所求的值.根据题意,我们可以得到以下方程:
2+1=3
3−1=x
得:x=2
所以,3−1 等于 2.
RiverMud
355 天前
按照微博阑夕设计的问题问了一下星火认知、文心一言和 gpt3.5 模型的 ChatGPT 。

问了前六个问题,星火认知答对 4 个,文心一言答对 1 个,gtp3.5 模型的 ChatGPT 答对 4 个。

问题连接: https://video.weibo.com/show?fid=1034:4889999422980118

一个刚推出的中文通用大模型综合性基准 SuperCLUE 认为星火认知仅次于 gpt3.5 和 gpt4 。

项目地址: https://github.com/CLUEbenchmark/SuperCLUE

以上内容均为客观过程描述,不代表个人认同其方法、结果及排名。
autoxbc
355 天前
用 ChatGPT 的间隙偶尔也试了文心一言,有时候也有意料之外的品质回答。所以最终可能需要一个整合输入框,一问十答,说不定谁的返回更好一点。以及,马上就要直面钟表匠悖论了,信息越多越茫然
lhbc
355 天前
科大讯飞的讯飞星火被曝是套壳 openai 的 chatgpt 的
来源: https://twitter.com/xcl2022/status/1656015056990265344
worldquant
355 天前
贴牌而已哪有创新
Perry
355 天前
@lhbc 就 1 张图,说实话不能算是实锤,因为也可以用 prompt 来让其回答你想要的答案
litmxs
355 天前
@lhbc 说不定拿的 gpt 的输入输出做的训练集
lovestudykid
355 天前
@lhbc #7 用提示词忽悠模型的可能性高达 99.99%
gynantim
355 天前
国外一有创新,国内就百花齐放了
emeab
355 天前
星火确实是国内做的最好的. 还有说套壳的大可不必, 因为比 gpt3.5 还是有差距的
https://github.com/CLUEbenchmark/SuperCLUE
具体可以看这个评测
TabGre
355 天前
国内一个平台都没有试用,感觉浪费时间。
fkverexadmin
355 天前
@emeab 肯定是套壳的,不过在结果返回时做了点手脚,故意乱答了其中的三到四分之一
RandyLuo
355 天前
有趣的是它说自己的模型数据也是到 21 年 9 月(用英文对话可以问出来,中文问不出)
https://twitter.com/zhangjintao9020/status/1655541511805599747
新的 Magic Number
Lefi
355 天前
crokily
355 天前
@lhbc 这张图大概率假,ai 生成的对话通常全面啰嗦,“我是由 OpenAI 开发的”太言简意赅了,它通常会说“我是一个由 OpenAI 的 brbrb”,得自我介绍一个长句才结束
makelove
355 天前
只能说现阶段的 ai 还没有护城河,基本技术原理基本都是公开的
wagmi
355 天前
bug 已修复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/938725

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX