现在 AI+的工作还挺常见的,就像大佬们说的,“所有行业的产品可能都会用 AI 重新做一遍”。最常见的就是各种 agent ,说要用 AI 赋能传统行业啥的,代替人类专家去处理海量的复杂资料、进行深度分析并做出决策。
举个例子,金融行业的“智能审计与尽调 Agent”。
过去,银行或投资机构想要给一家企业贷款或投资,需要人类审计师去读几十份、每份几百页的招股书和财务报表。现在虽然有了 AI ,但把文件一股脑全丢给它是不现实的,且不说烧 token 的问题,这些文档里有无数的跨行、跨列单元格表格,普通工具一拉,表格数据全串行了。如果 AI 把“第一季度利润”和“第二季度支出”的信息碎在一块,那得出的财务分析就完蛋了。
所以,现在要真想开发出一个能干活,还确保正确率的 agent ,就需要一个专业的、AI-native 的解析工具,把复杂的表结构和章节层级完整还原出来。我做的工具 Knowhere 就是干这个的: https://knowhereto.ai/?utm_source=v2ex
它能把复杂量大的文件,解析成按章节、按次序分类的 JSON ,尤其是令 AI 头大的 PDF 、PPT 、图片、表格等格式文件。其次它会把解析好的文档进行结构化,重建文档的标题树,从一级标题到二级、三级,每一块文本都会被挂载到对应的章节路径上。表格和图片也不是单独抽出来当独立附件,而是和内联的上下文文本牢牢绑定,确保 AI 能看到“这张表格是属于哪一段话”。
最后它还会构建一个包含章节树、文本块、摘要、图像描述以及跨文档链接的轻量级记忆图谱,方便 AI 检索和查找。
装了这个插件之后,agent 的表现会比使用原始文档的时候“正常”很多,我们亲测准确度是有提升 25%以上。
之后再给审计 Agent 分配财务分析任务的时候,它就会自己调用 Knowhere 进行对账了,如果它发现某些数据对不上,还能顺着 Knowhere 提供的记忆图谱返回去重新查验证据,确保交出来的审计报告,每个数据都是可追溯、可查验的。
当然,不只是做金融行业的 agent ,像法律、医疗、企业内网等历史问题比较多,资料比较复杂的场景的 AI 应用,都可以用得上。无论历史文档有多么稀奇古怪、排版脏乱差,Knowhere 都能帮 AI 解析得井井有条,在节省 token 的同时,帮 AI 把活干好。
如果有在做 agent 开发的老哥,欢迎使用,我们现在已经开源了,大家多多评论反馈哈,我会及时改进的: https://github.com/Ontos-AI/knowhere
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.