我尝试用了科大讯飞的星火模型,感觉国内的 Chatgpt 要崛起了!

2023-05-09 22:23:22 +08:00
 miv

使用体验:

  1. 问答效果流畅
  2. 和 GPT 一样,也是离线访问的
  3. 讯飞的有时候有点头铁,问问题没有 GPT 那种胡诌的感觉
  4. 写代码能力感觉还行,很强
  5. 其他交给 v 友补充
16394 次点击
所在节点    OpenAI
136 条回复
wssjy1234
2023-05-10 22:42:02 +08:00
@gtgc2005 GPT 可以给 python3.11 的安装教程
gtgc2005
2023-05-10 23:12:06 +08:00
@ccsexyz GPT3.5 它开始说胡话了,我问了它 3 遍,它分别给了我 3.10.1 3.10.2 3.10.3 的时间,并且每次都说这是截止刀它数据库的最后时间
星火:它给了一个跟 GPT 无限接近的回复(截至我知识库的最后更新日期(2021 年 9 月),Python 的最新稳定版本是 Python 3.10 。然而,Python 3.10 尚未发布,)
感觉这个反而可以证明他们之间的关联性,哈哈哈。
@wssjy1234 你说得对,我晚上多次测试,发现有时候可以回复 3.11 ,但是有时候又不行
ccsexyz
2023-05-10 23:24:03 +08:00
@gtgc2005 有趣的一点是,我提问输入是 "GPT4 的发布时间",星火回复

"我和 OpenAI 、ChatGPT 没有关系,我是讯飞星火认知大模型,我是由科大讯飞优秀的人工智能科学家、工程师和语言学家等组成的团队自主研发的。"

有种不打自招的感觉,哈哈。
1KN6sAqR0a57no6s
2023-05-10 23:27:08 +08:00
虽然对国内的 chatgpt 没有什么期待,但是动不动就说是套壳是非常无聊的行为。
MZSAN
2023-05-11 03:55:46 +08:00
个人测试下,,总的来说 讯飞的模型在问题理解上经常会犯常识性的错误,而且会在回答过程中自己就偏了题(这个效果和 gpt2 很类似)。此外,讯飞的回答总是十分宽泛,有一种说了也是白说的感 jio~

星火似乎对某些常问的问题提前设定好了,举个例子 问它一棵树上有 10 只鸟打死一只还有几只 它能答的不错,而把 10 换成 114514 就开始胡言乱语了。

说实话,试用了几次星火大模型后 已经没了兴趣。ta 的能力偏弱,也没有文生图之类的附加能力。。给我的感觉,ta 可能就是个在开源的 llama 模型基础上进行的魔改~

另外我在对话过程中也多次问出了漏洞,,似乎发觉星火大模型是在回答输出时 检测是否有涉及到敏感信息或询问其开发公司等回复,检测到后进行替换(哪怕是答非所问)。虽然是小概率,但不能排除 gpt 套壳的可能。

另外也有一个极大的可能,讯飞在训练模型时 使用了 ShareGPT 或其它类似的 GPT 对话数据集,导致了当下星火大模型所出现的回答逻辑与 ChatGPT 相像、询问开发信息时答复 OpenAI 等等问题。

如果星火大模型确是在数据来源上大量取自 chatGPT 的对话,一方面这在最终呈现的效果上又成了另一种形式的套壳,另一方面该模型的文本质量必定是低于 chatGPT 的,更别提超越了。。。
locoz
2023-05-11 10:10:23 +08:00
@miv #77 这个 mxT52CRuqR6o5 我一点开就看到之前打过标记,这人一直就这样
locoz
2023-05-11 10:14:56 +08:00
@teenight #96 大模型一直有公司在做,只是人家不一定做了问答式的针对训练。你如果有关注这块就会发现,现在频繁出现的新的对话 AI ,基本可以说都是基于之前的模型增加了对话训练之后的产物。
tyrone2333
2023-05-11 10:32:00 +08:00
国内这些平台要实名认证吗? 会屏蔽敏感话题吗?
CJ2r4u3EH4lrM7aR
2023-05-11 19:52:56 +08:00
@TabGre 而且一贯的要手机号,好不要脸
scruel
2023-05-12 11:36:56 +08:00
@zhchyu999 #31 为了钱什么事都干得出来 ,而且确实论证比较困难,同时也是估计 OpenAI 或微软大概率不会管,就算是用了数据集,也仍然算是侵权这点,讯飞能不知道?
套壳也要做的足够稳定才好发布吧,尤其对于大公司来说,这点颜面不能丢吧?我认识的一个套壳站的站长,也是知名爬虫书的作者,从立项到公测到较为稳定,也足足用了有三个月之久,当然他只靠自己一个人,公司的话,如果立项晚了,那要花点时间也很正常。
@kerb15 #48 "大部分人对 GPT 的认知还是太片面了,生成式 AI 的回答本来就是拼接的,问他背后是什么模型这种问题去论证套壳就很傻"
或许可以解释一下它为什么时常回答完全一样的内容,提供的几个示例甚至都能复现。
@miv 这种东西个人很有十足的证据,只能靠自己做判断,也没有必要做任何的争论,但单看他给出的一些回答来说,我觉得是能得出这玩意“大概率”是套壳的结论的。
scruel
2023-05-12 11:38:40 +08:00
谈谈科大讯飞星火认知大模型关于”套壳“的论调
https://zhuanlan.zhihu.com/p/628744316
scruel
2023-05-12 11:44:26 +08:00
#130 最后的回答漏打了,是“很难有”,总之你要说不是套壳,一定要让个人去曝光公司的商业机密,那只能说也同样是在做非蠢即坏的无理请求,据我了解公司内部不同组的人,都不清楚这个项目的具体情况,却有人想让完全没点关系普通人,来给出一个十足的实锤证据?而且再者说,但看本贴的一些截图(建议大家都录屏,甚至手机录,省的被人说有诱导),以及个人的实测,我仍然保持“大概率”是套壳的观点。
GPT 胡说八道,容易被诱导的特点,反倒是让某些做套壳(不要急着喷,未指名道姓)的,有了说是自研的勇气。
miv
2023-05-12 12:09:06 +08:00
@scruel 没有说要曝光公司机密,只是要拿出能说服大家的证据,这个你就偷换概念了。截图这些太容易伪造了,上下文都说不出来,没啥意义。
scruel
2023-05-12 12:10:29 +08:00
@miv 我有录视频,几个测试都没有上下文诱导,你要不来个邮箱,届时我发你你自己评判(
scruel
2023-05-12 12:14:12 +08:00
@scruel 补充,如果怕泄露手机号信息的话,可以参考 #131 的帖子最后小彩蛋部分,可以让你能打开 F12 ,删掉拙劣的水印层。
postmanjoker
2023-06-08 17:53:53 +08:00
有些地方确实不错,比其他国内兄弟强不少。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/938725

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX