套皮 AI 的应用乱象

191 天前
 purensong

先叠甲,个人看法,没有说别人做的不好,觉得不对的可以联系我删帖。

偶然看到的一个 AI DB 应用,https://zhuanlan.zhihu.com/p/648633185

看了下官网和文档挺像回事,github 的 star 还挺高,可随即我仔细看了下 SQL 就发现了错误 截图来自官方文档 https://doc.sqlgpt.cn/zh/ai/nl2sql/ 表 student_course 是没有 score 字段的。

同样的需求我用 minimax 给出了正确的答案,所以他们用的 AI 大模型可能是通用的,并不是专业的 SQL 大模型,耗时 6 个月做出来也不仔细校验 SQL 的正确性,就想着完成项目骗 star ?

我个人想法是这种用大模型加持的应用越来越多是好事,但是单纯的套皮就会出现准确性专业性的下降,这种应用的核心还是专业的模型,而不是通用的,其他体验上面的优化我觉得都是次要。作为大学生的毕设项目我觉得不错,但是在阿里开源这种项目是不是有点滥竽充数了。

最后说点个人想法,自从国外 gpt 出来后,国内的各种大模型如雨后春笋般冒出来了,别人没出来前你们是一声不吭,差距不是一般大呀,作为程序员,对所做的事会越来越没成就感吧,因为 AI 的能力越来越强了,未来我们何去何从,是不是面试的时候问一句,你会 gpt 吗?有没有懂的老哥一起讨论一下,最近 gpt 课程也是卖的越来越火,传统 JAVA 课程已经没人学了吧。我们该怎么抓住风口上的机会,还是说最终它就是一场闹剧,我们都是帮 AI 更好的工具人,作为廉价语料喂给了 AI 。

956 次点击
所在节点    程序员
3 条回复
purensong
191 天前
老哥们可以聊下还有哪些套皮 AI 应用,我看那个项目也早就发布了,我今天才看到....
tangtang369
191 天前
应该用的是 chatgpt 只是自己套了一层 prompts
sunsan05
189 天前
有些开源模型,需要自己做 RLHF 矫正或自己做大量的 QA 然后 LORA 一下。比如开源项目 CHATRWKV 。
这些基础模型里面已经有过一定量的 SQL 文本录入,所以矫正起来还是有空间的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/986789

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX