RAG 系统如何处理总结性任务？

如果用户要总结一个超大文本，这种任务需要 RAG 单独设计一个逻辑，目前业界似乎没有一个好的解决方案。

参考了腾讯的 IMA ，它的总结是直接拿固定长度的文本放到上下文的；
NotebookLLM 总结的效果不错，推测是直接利用了 Gemini 的长上下文做的；

目前用的本地 AI 上下文长度比较短，限制了 AI 的发挥，所以只能在建索引库的时候做优化了。
有没有大佬指导有什么方案可以达成速度和准确性均衡的方案？

目前是想每 n 段文本 Chunk 生成一个总结内容，但是这样还是会速度很慢。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1161945

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.