我做了一个本地 AI 搜索工具,今天正式开源了!

1 月 31 日
 dtsola

前言

花了一段时间,我终于把小遥搜索 XiaoyaoSearch做出来了。 这是一个支持语音、文本、图片多模态输入的本地 AI 搜索桌面应用。最特别的是,它100%通过 Vibe Coding ( AI 辅助编程)实现,从零开始,所有源码、设计文档、开发经验,今天全部开源。

为什么要做这个工具?

作为知识工作者,我经常遇到这些痛点: ● 文件太多找不到:电脑里存了成千上万个文档、图片、音视频,想找个特定内容翻半天 ● 搜索不够智能:系统自带的搜索只能匹配文件名,搜不到文件内容 ● 隐私安全担忧:很多搜索工具要上传数据到云端,不太放心 ● AI 工具太复杂:想用 AI 提升效率,但不会配置,门槛太高 所以我就想:能不能做一个本地运行的、支持多种输入方式的 AI 搜索工具?

小遥搜索是什么?

简单来说,它是一个本地 AI 搜索桌面应用,核心特点:

🎤 多模态输入 ● 语音搜索:点一下录音,说出你要找的内容,30 秒内语音自动转文字搜索 ● 文本搜索:输入关键词,AI 理解语义,精准匹配文件内容 ● 图片搜索:上传一张图片,AI 理解图像内容,帮你搜索相关文件

🔍 深度检索 ● 文档:TXT 、Markdown 、Word 、Excel 、PPT 、PDF 全文检索 ● 音视频:MP4 、AVI 、MP3 、WAV 内容索引和搜索(支持 10 分钟内音视频字幕提取) ● 文件名:传统的文件名搜索也不缺席

🧠 AI 技术 集成了多个先进 AI 模型: ● BGE-M3:文本嵌入,理解语义 ● FasterWhisper:语音识别,语音转文字 ● CN-CLIP:图像理解,以图搜图 ● Ollama:本地大语言模型

🔒 隐私安全 ● 完全本地:所有数据处理都在本地,不上传云端 ● 隐私模式:可选不记录搜索历史 ● 自主可控:数据完全由你自己掌控

核心界面一览

搜索主界面

文本搜索

语音搜索

图片搜索

技术架构

前端:Electron + Vue 3 + TypeScript 后端:Python 3.10 + FastAPI AI 引擎:BGE-M3 + FasterWhisper + CN-CLIP + Ollama 搜索:Faiss (向量搜索)+ Whoosh (全文搜索) 数据库:SQLite 系统架构图

Vibe Coding 实践案例

这是我特别想分享的部分。 这个项目从零开始,完全通过 Vibe Coding 实现,包括:

● ✅ 完整源代码(前端 + 后端 + 所有功能模块) ● ✅ 设计文档( PRD 、技术方案、数据库设计、API 文档) ● ✅ 开发流程(任务分解、进度跟踪、测试验证) ● ✅ 部署配置(环境搭建、依赖管理、打包发布) 开源的价值:对于想要学习 AI 辅助开发、本地 AI 应用、Electron 桌面应用的开发者,这是一个完整的参考实现。

产品路线图

当前版本( v1.1.1 )✅ ● 多模态 AI 搜索(语音、文本、图片) ● 本地文件深度检索 ● AI 模型灵活配置 ● 隐私安全保护

未来规划

🚀 微内核架构演进 插件化系统,支持自定义扩展

🌐 多数据源扩展 ● 文档协作平台(语雀、飞书、Notion ) ● 项目管理平台( Jira 、禅道、GitHub ) ● 实时同步和智能缓存

🎬 音视频搜索增强 ● 视频画面内容理解和搜索 ● 长视频处理(集成水母平台) ● 音频声纹识别和情感分析

🧠 RAG 系统升级 ● 自适应分块算法 ● 知识图谱构建 ● 检索结果智能增强

💬 智能聊天助手 ● 多轮对话和上下文记忆 ● 基于本地知识库的问答

🔌 MCP 能力集成 连接 Claude 生态,扩展 AI 能力 详细路线图:ROADMAP.md

适合谁使用?

知识工作者 搜索本地文档、笔记、研究报告,快速定位关键信息 内容创作者 搜索素材和灵感,整理音视频内容,管理创作资源 技术开发者 搜索代码库和技术文档,整理学习资料,管理项目文件 研究人员 搜索论文和研究资料,整理文献笔记,管理研究数据

邀请你参与

为什么需要你? 一个人的力量有限,开源社区的力量是无限的! 优先贡献方向

  1. 插件系统开发(高优先级) ○ 设计插件接口规范 ○ 实现插件加载机制
  2. 多数据源连接器(高优先级) ○ 语雀、飞书、Notion API 集成
  3. UI/UX 优化(中优先级) ○ 搜索结果展示优化 ○ 暗色模式支持
  4. 性能优化(中优先级) ○ 大文件处理优化 ○ 索引构建速度提升
  5. 测试覆盖(中优先级) ○ 单元测试补充 ○ 集成测试完善

项目地址

GitHub:https://github.com/dtsola/xiaoyaosearch

欢迎: ● ⭐️ Star 本项目,关注最新进展 ● 🍴 Fork 本项目,开始你的贡献 ● 👀 Watch 本项目,及时获取更新 ● 🐛 提 Issue ,报告问题和建议功能 ● 💡 参与讨论,分享你的想法

关于我

dtsola - IT 解决方案架构师 | 一人公司实践者

● 网站:https://www.dtsola.com

● B 站:https://space.bilibili.com/736015

开源协议

本项目采用小遥搜索软件授权协议:

● ✅ 免费使用(非商业用途) ● ✅ 可以学习和研究代码 ● ✅ 可以修改后二次分发(需保留版权声明和协议) ● ✅ 可以集成到其他非商业项目 ● ❌ 商业使用需授权

这是一个类似 CC-BY-NC-SA 的开源协议,鼓励学习、分享和贡献! 详细协议:LICENSE

结语

小遥搜索是我对本地 AI 搜索工具的一次探索和实践,也是 Vibe Coding 的完整案例展示。 我相信,开源社区的力量会让这个项目变得更好。 无论你是: ● 🔨 想要贡献代码的开发者 ● 💡 想要提供建议的产品经理 ● 📖 想要学习 AI 应用的学生 ● 🚀 想要参与创业的伙伴

都欢迎加入我们,一起打造更好的本地 AI 搜索工具! 让我们一起,用 AI 技术改变知识管理方式! 🚀

2293 次点击
所在节点    分享创造
8 条回复
KunpengTalk
1 月 31 日
我刚看以为是一个搜索引擎
kuse2001
1 月 31 日
赞!先 star 为敬
dtsola
2 月 1 日
@kuse2001 感谢
dtsola
2 月 1 日
@KunpengTalk 嗯,简单来说小遥搜索是一款能听会看的本地 AI 搜索工具,让你用语音、文字、图片秒找电脑里的任何文件,数据全程本地处理,隐私安全有保障。
zololiu
2 月 1 日
先 star 一个了。
dtsola
2 月 1 日
@zololiu 非常感谢
VwEI
5 月 11 日
先 star 一个了
dtsola
5 月 13 日
@VwEI 非常感谢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1189716

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX