很好奇 RAG 真的是现代 ai agent 所需要的吗,还有 langchian 这种框架,没有看到太多知名开源项目用到了

9 小时 48 分钟前
 murongxdb
2454 次点击
所在节点    程序员
43 条回复
ZimaBlueee
9 小时 47 分钟前
知识库类的需求还是要的吧,不然还有什么替代呢
murongxdb
9 小时 45 分钟前
@ZimaBlueee 感觉知识库算不上符合 harness 规范的现代 agent
ktyang
9 小时 40 分钟前
我们尝试了一下效果并不是很好,反正现在不用了,也可能是我们自己菜。
murongxdb
9 小时 39 分钟前
@ktyang 是指的 RAG 还是 langchain 这种
YanSeven
9 小时 31 分钟前
同样好奇,尤其是好奇 langchain 的实际落地情况。
Jiahim
8 小时 55 分钟前
最近也在思考这个问题,探讨一下,在数据量不大的情况下,rag 可能并没有效果那么好,反倒成为一个额外的工作量。
现在如果是传统的文本切片做 rag ,其实当数据量大之后,一方面不一定准确,另一方面如果数据有变化后,所有相关的文本其实会面临过时且难以修改的问题。
现在大一点的项目可能会用基于知识图谱的 Rag ,这个可能在未来的落地后更可靠些。它可以维护住事物之间的关系,也能确保更新后是彼此正确的。
hqmJoker
8 小时 52 分钟前
我感觉还是有的(但没有真实数据),应该是用的大部分都是企业级产品,或者企业内部用的,消费者日常接触不到所以感受不深

就像我之前觉得 Angular 在国内基本没有企业会用吧(又长又臭的),但是实际是入职的三家公司有两家都是用的 Angular (虽然体量还是比 Vue 少多了,但是也有点刷新了我的看法)

“幸存者偏差”真的哪里都存在,就像你现在感觉没啥人 RAG 、langchian ,但当你接触到那个圈子之后,就会发现身边的人、企业全部都在用这些东西,为啥市面上还有人没听过?
ZimaBlueee
8 小时 45 分钟前
@murongxdb #2 像法律条文这种海量文件场景,不搞 RAG 怎么定位相关文件呢
mjawp
8 小时 44 分钟前
RAG 就是是一套固定 SOP 的 workflow 。
juvenile1024
8 小时 44 分钟前
longchain 还是太简陋了,用的更多的应该是 longgraph
murongxdb
8 小时 42 分钟前
@Jiahim 之前看过一个文章,说是 anthropic 公司做 claudecode CLI 的时候,初版就是用的 RAG 做文本的检索,但是后来他们发现 RAG 做起来很麻烦而且收益不是很大,就换成了 grep 命令检索文本,结果效果出奇的好,我目前能想到唯一能用到 RAG 的地方就是大文本的知识库系统,但是大文本的知识库系统跟现代的和 herness engineering 没太大关系
murongxdb
8 小时 41 分钟前
@hqmJoker 确实有“幸存者偏差”,但是阅读过很多优秀的 agent 开源项目,很少很少使用 langchain 的,是因为 langchain 这类框架不够好,还是根本没有用的必要
skyemin
8 小时 37 分钟前
阿里的 agentscope 咋样
Jiahim
8 小时 32 分钟前
@murongxdb #11
在程序员编码语境下的 RAG 可能确实价值并不大,但是如果是业务系统语境在的 AI Agent 可能还是有的,比如类似 chatbi 的系统,里面的 Agent 如果要生成报表生成 SQL ,需要知道各种隐性知识之间的关系,此时基于知识图谱的 RAG 作为 AI Agent 的隐性知识来源,就显得有价值了。
Hstar
8 小时 27 分钟前
先说 RAG, 当有数据的量级大到难以注入给 Agent 的文件系统时, 甚至量大到连数据索引都可能会超 100K token 时, RAG 才有必要. 大部分情况下直接把引用内容挂到 Agent 的文件系统里, 加三五行对文件结构的介绍, 让 AI 用 ls 和 grep 去使用, 效果就很好了.
再说 langchain, 我觉得定位于一个新 Agent 产品的 bootstrap 还是不错的. 迭代下去总会发现有不能满足的需求, 还有多余的功能. 在 AI 加持下参考基于 langchain 的项目代码, 再从头撸一个也不费什么事.
murongxdb
8 小时 25 分钟前
@ZimaBlueee #8 我感觉这种海量的场景,就直接针对场景训练模型吧
murongxdb
8 小时 24 分钟前
@Jiahim #14 这种场景,除了 RAG 还有没有更好的方案
murongxdb
8 小时 23 分钟前
@Hstar 海量数据情况下,RAG 的性能够不够
Jiahim
8 小时 22 分钟前
@murongxdb #17 应该说没有银弹,就是一直在更新,现在是多种检索方案去配合,简单的切片 RAG 、知识图谱、传统的 SQL 查询都会用到,还有一些模型识别 top N 等等。
Chihaya0824
8 小时 13 分钟前
@murongxdb 你是否在找
https://arxiv.org/html/2605.15184v1
前几天才看见这个 paper

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1214405

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX