有没有用自然语言进行文档内内容搜索的工具?

2024-07-25 19:32:16 +08:00
 ztfot

理想的搜索过程: 打开搜索框( Mac 的 Spotlight) -> 输入一句话 -> 根据语意自动搜索到最相关的几个文档 -> 打开文档跳转到某一页

1825 次点击
所在节点    程序员
12 条回复
shrugginG
2024-07-25 19:49:49 +08:00
好想法,码住回来看
Pteromyini
2024-07-25 20:03:26 +08:00
emmm 其实这是 RAG 的基本步骤,根据词向量检索相似度,fastgpt ,dify 之类的都能实现
xkongstore
2024-07-25 20:04:37 +08:00
Locus 这个插件
Inn0Vat10n
2024-07-25 20:06:03 +08:00
现在的百度、Facebook 、Google 之类的搜索引擎背后都是带语义检索的啊,这块业界很成熟了,主要还是向量化搜索的方式去做的
beyondex
2024-07-25 20:06:26 +08:00
sea desktop search 的 AI 版本可。就是对文本 embedding 索引,然后向量搜索。同时支持传统分词搜索。
不过由于没用 gpu 加速 embeddding 索引生成过程很慢,搜索挺快。
beyondex
2024-07-25 20:07:17 +08:00
不过是给你相关文件&提供高亮预览的,不是你指定一个文件,然后针对他搜索的。
googlefans
2024-07-25 20:30:43 +08:00
这需求估计以后会集成到系统里
ztfot
2024-07-25 21:36:25 +08:00
@beyondex 这个怎么看起来这么原始呢
ztfot
2024-07-25 21:37:02 +08:00
text-embedding 都已经出来这么久了,不知道为什么 Github 上没有人做这个,直接集成在系统中的
hez2010
2024-07-25 21:41:22 +08:00
微软其实有这个功能,但是只是企业版限定。当你有 Microsoft 365 企业授权之后,在 Bing 登录你的工作账号之后就能用搜索了。它会直接集成你们整个企业的内容进行索引,所以直接就能搜出任何内部资料,并且还会根据每个人的权限不同过滤展示不同的搜索结果,问 Copilot for Microsoft 365 问题也是直接从你们企业资料作为数据来源结合搜索一起出结果。
feiyan35488
2024-07-25 21:52:45 +08:00
RAG , 会返回引用文档和引用片段,加上点击定位就可以了
109021017
2024-07-26 11:28:15 +08:00
Google 的 Gemini 可以用自然语言搜索 Gmail, Google Docs, Google Sheets 中的内容.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1060111

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX