求个人 wiki 。请教有没有适合快速搜索大量文本文件的软件?

2013-04-03 20:55:45 +08:00
 gdm
如题,有上千个纯中文 txt ,加起来大概 700mb ,未来会继续增加。并且,希望出搜索结果时能看到文本文档的标题。
本人 windows 用户,需要 windows 下的方案,至少是 cygwin 能跑的方案。

考虑过 vimwiki ,但是命令繁琐,搜索还要切输入法。而且对付这么多文档,速度也不行了。
考虑过放 jekyll ,但想想一来 google 的蜘蛛可能不抓,二来这么多东西放一个 repo 万一 github 封号咋办,这不白传了么……
考虑过 google 桌面搜索之类,但据说索引慢,而且希望有稍微便携一点的手段。
考虑过搭建 mediawiki ,这方案解决了搜索和显示的问题,但这么大的数据库一台破电脑能跑得动么?之前用 wordpress 弄个人小站就曾经被凌乱无比的数据库恶心过,对这类方案比较小心。
考虑过 stardict/goldendict ,但是辞典制作起来好像不是那么轻松,而且不方便以后添加。
考虑过 evernote ,慢,做笔记一直 onenote ,从不搜笔记,没比对过笔记软件的搜索功能。

说一下为什么需要吧。原来有个百度国学,很简陋,书也少,但挺方便。后来可能这项目不赚钱,悄无声息的砍掉了。打算自建一个类似的东西。
总之需求不高:搜索、便于增删、速度。界面丑无所谓,也不需要图片和富文本。对这方面不大了解,求推荐。
6641 次点击
所在节点    问与答
22 条回复
gdm
2013-08-31 07:58:54 +08:00
@weakish 谢谢。书的主体是别人发的网络收集,每个单本都很容易获得,其中 doc 文件的比例非常高,还在逐步整理成 txt 。感觉如果公布, git 模式还是最好的。不过认真看时,对于用字比较生僻的书籍,错字不是一般的多,贸然上传有传播流毒之嫌,所以当初考虑还是以本地为主。另外自己干了一件蠢事,把同一书籍存成多个文件的用 cmd 合并了,导致单文件过大,想重新下载也没了……
ddup
2020-01-12 20:36:30 +08:00
桌面全文搜索小于 10MB 的话,归海数据是不错的选择。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/64875

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX