我尝试用了科大讯飞的星火模型，感觉国内的 Chatgpt 要崛起了！

gtgc2005

2023-05-10 23:12:06 +08:00

@ccsexyz GPT3.5 它开始说胡话了，我问了它 3 遍，它分别给了我 3.10.1 3.10.2 3.10.3 的时间，并且每次都说这是截止刀它数据库的最后时间
星火：它给了一个跟 GPT 无限接近的回复（截至我知识库的最后更新日期(2021 年 9 月),Python 的最新稳定版本是 Python 3.10 。然而，Python 3.10 尚未发布，）
感觉这个反而可以证明他们之间的关联性，哈哈哈。
@wssjy1234 你说得对，我晚上多次测试，发现有时候可以回复 3.11 ，但是有时候又不行

ccsexyz

2023-05-10 23:24:03 +08:00

@gtgc2005 有趣的一点是，我提问输入是 "GPT4 的发布时间"，星火回复

"我和 OpenAI 、ChatGPT 没有关系，我是讯飞星火认知大模型，我是由科大讯飞优秀的人工智能科学家、工程师和语言学家等组成的团队自主研发的。"

有种不打自招的感觉，哈哈。

1KN6sAqR0a57no6s

2023-05-10 23:27:08 +08:00

虽然对国内的 chatgpt 没有什么期待，但是动不动就说是套壳是非常无聊的行为。

MZSAN

2023-05-11 03:55:46 +08:00

个人测试下，，总的来说讯飞的模型在问题理解上经常会犯常识性的错误，而且会在回答过程中自己就偏了题（这个效果和 gpt2 很类似）。此外，讯飞的回答总是十分宽泛，有一种说了也是白说的感 jio~

星火似乎对某些常问的问题提前设定好了，举个例子问它一棵树上有 10 只鸟打死一只还有几只它能答的不错，而把 10 换成 114514 就开始胡言乱语了。

说实话，试用了几次星火大模型后已经没了兴趣。ta 的能力偏弱，也没有文生图之类的附加能力。。给我的感觉，ta 可能就是个在开源的 llama 模型基础上进行的魔改~

另外我在对话过程中也多次问出了漏洞，，似乎发觉星火大模型是在回答输出时检测是否有涉及到敏感信息或询问其开发公司等回复，检测到后进行替换（哪怕是答非所问）。虽然是小概率，但不能排除 gpt 套壳的可能。

另外也有一个极大的可能，讯飞在训练模型时使用了 ShareGPT 或其它类似的 GPT 对话数据集，导致了当下星火大模型所出现的回答逻辑与 ChatGPT 相像、询问开发信息时答复 OpenAI 等等问题。

如果星火大模型确是在数据来源上大量取自 chatGPT 的对话，一方面这在最终呈现的效果上又成了另一种形式的套壳，另一方面该模型的文本质量必定是低于 chatGPT 的，更别提超越了。。。

locoz

2023-05-11 10:10:23 +08:00

@miv #77 这个 mxT52CRuqR6o5 我一点开就看到之前打过标记，这人一直就这样

locoz

2023-05-11 10:14:56 +08:00

@teenight #96 大模型一直有公司在做，只是人家不一定做了问答式的针对训练。你如果有关注这块就会发现，现在频繁出现的新的对话 AI ，基本可以说都是基于之前的模型增加了对话训练之后的产物。

tyrone2333

2023-05-11 10:32:00 +08:00

国内这些平台要实名认证吗? 会屏蔽敏感话题吗?

CJ2r4u3EH4lrM7aR

2023-05-11 19:52:56 +08:00

@TabGre 而且一贯的要手机号，好不要脸

scruel

2023-05-12 11:36:56 +08:00

@zhchyu999 #31 为了钱什么事都干得出来，而且确实论证比较困难，同时也是估计 OpenAI 或微软大概率不会管，就算是用了数据集，也仍然算是侵权这点，讯飞能不知道？
套壳也要做的足够稳定才好发布吧，尤其对于大公司来说，这点颜面不能丢吧？我认识的一个套壳站的站长，也是知名爬虫书的作者，从立项到公测到较为稳定，也足足用了有三个月之久，当然他只靠自己一个人，公司的话，如果立项晚了，那要花点时间也很正常。
@kerb15 #48 "大部分人对 GPT 的认知还是太片面了，生成式 AI 的回答本来就是拼接的，问他背后是什么模型这种问题去论证套壳就很傻"
或许可以解释一下它为什么时常回答完全一样的内容，提供的几个示例甚至都能复现。
@miv 这种东西个人很有十足的证据，只能靠自己做判断，也没有必要做任何的争论，但单看他给出的一些回答来说，我觉得是能得出这玩意“大概率”是套壳的结论的。

scruel

2023-05-12 11:38:40 +08:00

谈谈科大讯飞星火认知大模型关于”套壳“的论调
https://zhuanlan.zhihu.com/p/628744316

scruel

2023-05-12 11:44:26 +08:00

#130 最后的回答漏打了，是“很难有”，总之你要说不是套壳，一定要让个人去曝光公司的商业机密，那只能说也同样是在做非蠢即坏的无理请求，据我了解公司内部不同组的人，都不清楚这个项目的具体情况，却有人想让完全没点关系普通人，来给出一个十足的实锤证据？而且再者说，但看本贴的一些截图（建议大家都录屏，甚至手机录，省的被人说有诱导），以及个人的实测，我仍然保持“大概率”是套壳的观点。
GPT 胡说八道，容易被诱导的特点，反倒是让某些做套壳（不要急着喷，未指名道姓）的，有了说是自研的勇气。

miv

2023-05-12 12:09:06 +08:00

@scruel 没有说要曝光公司机密，只是要拿出能说服大家的证据，这个你就偷换概念了。截图这些太容易伪造了，上下文都说不出来，没啥意义。

scruel

2023-05-12 12:10:29 +08:00

@miv 我有录视频，几个测试都没有上下文诱导，你要不来个邮箱，届时我发你你自己评判（

scruel

2023-05-12 12:14:12 +08:00

@scruel 补充，如果怕泄露手机号信息的话，可以参考 #131 的帖子最后小彩蛋部分，可以让你能打开 F12 ，删掉拙劣的水印层。

postmanjoker

2023-06-08 17:53:53 +08:00

有些地方确实不错，比其他国内兄弟强不少。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/938725

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.