CloseVector: 免费的 Vector Database / 向量数据库

284 天前
 MegaPortal

先说缺点 😅:

  1. 慢:服务部署在美东,500ms+ 毫秒的检索;
  2. 建立索引依然很慢,每条记录 500ms+ 的插入;
  3. 插入索引不支持并发;
  4. 索引大小被限制在 4MB ,大约 500 条记录;
  5. 无法删除单条记录;

优点:

  1. 目前免费:整个套解决方案最贵的应该是 OpenAI Embeddings 的费用;
  2. 查询的可伸缩性能应该还可以;

适用场景:

  1. ChatWithPDF/PPT 之类的应用,单篇文章检索;
  2. 候选条目在 500 或者以下的推荐,具体 DEMO 可以查看项目首页: https://closevector.getmegaportal.com/

使用方法:

https://closevector-docs.getmegaportal.com/docs/tutorial

规划:

  1. 建立索引本地化,加快索引速度;
  2. 想办法讲索引大小的限制提升至 100MB 级别;

题外话:

最近经济形势确实不佳,外部机会有限,只能忍受 996 的工作环境。虽然想在 LLMs 这个浪潮中做些小项目,但是时间不允许。共勉。

1039 次点击
所在节点    分享创造
3 条回复
amoia50
284 天前
有 github 地址吗,学习下
MegaPortal
284 天前
@amoia50 后面完善完善,再考虑开源哈。
MegaPortal
230 天前
基于 Hnswlib ,重写了 CloseVector 的实现: https://closevector-docs.getmegaportal.com/blog/release

1. 通过 WASM, CloseVector 现在可以在浏览器上运行,这可能适合一些前端插件类的应用;
2. 我们添加了针对 node.js 和 web 的 npm 库,以便于快速集成,同时这些库与 langchain 是兼容的;
3. 创建数据库后,可以通过 API 上传到 CloseVector 后台,这样在 node.js 或 web 环境中方便下次加载和使用。

CloseVector 的文档站点的搜索功能是基于 CloseVector 本身实现的。您可以访问文档站点来体验: https://closevector-docs.getmegaportal.com/

查看文档站点的具体实现: https://github.com/MegaPortal/closevector-doc

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/961021

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX