一个私人“大数据”搜索引擎,秒搜硬盘,邮箱,笔记,历史剪切板全文

2018-09-28 15:27:49 +08:00
 ddup

部分功能已经可用了

先说下功能和思路

免费,一个私有化搜索引擎,通过它你可以以搜索引擎的方式搜索你的硬盘,邮箱,笔记,历史剪贴板。 在关键时刻大幅提升工作效率。

解决什么问题

个人工作数据搜索不便,确定电脑上存在但就是找不到

优点:

缺点:

和 Windows 自带全文索引的区别

还有企业版

挖掘潜藏在员工电脑的工作资料信息孤岛,聚合起来,自动形成内部资料搜索引擎、自动形成知识库和工作数据信息门户。 数据安全和隐私,也有考虑,企业可以部署私有云版,而员工是自行选选择哪些数据允许连入企业云。

使用效果截图

基于相似度匹配

输错也能搜

词记不全也能搜

全文索引

感兴趣?

目前内测中,试用,或者有什么看法可以加我 QQ 1926510340

14082 次点击
所在节点    分享创造
107 条回复
Telegram
2018-09-28 15:42:02 +08:00
感觉是不是可以用来做社工库?
ddup
2018-09-28 15:46:53 +08:00
@Telegram 你是说用它来索引你收集的社工资料库嘛?
技术上可以,我们一方面会根据需求强烈度去适配更多数据源,另一方面,也会开放编程接口,开发者可以自己写扩展支持自定义数据源,而且也就是套下模板的事,类似于数据导入。
allinoneok
2018-09-28 15:47:36 +08:00
不开源 不敢用
ddup
2018-09-28 15:49:14 +08:00
@allinoneok 还不确定要不要开源,如果不放心,可以用软件限制它的网络访问权限,无需联网。
HidingKing
2018-09-28 15:52:59 +08:00
和 Everthing 有啥区别
skschema
2018-09-28 15:54:21 +08:00
收藏,有些兴趣。个人资料收集整理不错。
ddup
2018-09-28 15:56:57 +08:00
@HidingKing Everthing 只能搜文件,不能搜内容,不能搜笔记,邮件,压缩包内文件,这个可以。
Everthing 是基于关键词的匹配,错一个字就搜不出,我们是基于搜索引擎式相似度匹配,搜索可以容错。
具体再仔细看下前面的说明。
imn1
2018-09-28 15:58:15 +08:00
1.前提不联网可以考虑
2.入库方式最好说一下,一天到晚扫描硬盘也是难受
3.可否另外修改库内记录,例如添加 tag/commit/description 之类
4.没有 QQ
我只是说说而已
est
2018-09-28 16:04:38 +08:00
只搜文件名的话,Everything
搜内容话,其实 10 年前 Google Desktop 都做了。然后死了。
ddup
2018-09-28 16:08:42 +08:00
@imn1
1.无需联网。甚至你可以用安全软件禁止它的连外网。只是后续会推出云服务,但这是可选的,你可以不加入,只是会没有云相关功能。
2.结合了 Everyting 技术,不会频繁扫硬盘。
3.后续会有的
4.我应该再放个微信二维码的~
ddup
2018-09-28 16:14:04 +08:00
@est 嗯,Google Desktop,百度硬盘搜索,都死了。
只是这个需求是存在的,用户搜电脑文件,多少有些不爽的,它是能解决问题的。
moocean
2018-09-28 16:15:26 +08:00
gao2008ss
2018-09-28 16:21:31 +08:00
和 鹰眼快搜,Google Desktop 都是同一类型的软件吧
awfe
2018-09-28 16:29:44 +08:00
嗯,想起用了好多年的 Google Desktop 咋说没就没了呢
est
2018-09-28 16:38:59 +08:00
@awfe 这个世界上解决问题的程度分 3 种:

1. 彻底解决
2. 不解决
3. 解决一半


其中解决一半是最恶心的。最糟糕的。还不如不解决。

就拿全文搜索来说,各种格式支持不好,多语言支持不好,就让这个功能成为了残废。

与其说弄死搜索不出来我想要的,还不如我自己注意文件夹的整理。。。

很多人后来就这样了。
ddup
2018-09-28 16:41:43 +08:00
@gao2008ss
目前来说是,长远来说不是,我们会做垂直数据挖掘,比如你是公司法务,电脑里有很多合同,我们会自动给你整理归类,识别合同里面的甲方乙方,然后同其它合同、邮件联系起来,最终给你建立一个私人工作资料信息门户。

如果是项目经理呢?那就深度挖掘各种项目文档,同时自动把电脑和邮件里面相同的项目,归类在一起,形成如下 Tag: 原始需求、需求变更、项目计划、测试相关,点击 Tag 可以看到相关资料等等,形成私人资料库,你可以把这个项目相关的资料库,共享给开发小组。
ddup
2018-09-28 16:49:58 +08:00
@est 没错,目前我用下来格式支持度还不错,我们要做的不仅仅是全文搜索,而是做垂直数据挖掘(下一步),还有下下一步,做下一步的前提是,我们要把搜索做好,目前我对实测搜索结果满意,还会进一步优化。
caomu
2018-09-28 16:51:32 +08:00
我选择 recoll
madNeal
2018-09-28 16:54:15 +08:00
我去年做过了 开源 不过目前还有很多 BUG 比如索引太慢 不过至少开源 欢迎围观 https://github.com/neal1991/everywhere
ddup
2018-09-28 17:10:44 +08:00
@madNeal
我居然还 Star 过 哈哈。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/493532

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX