V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
pythonee
V2EX  ›  问与答

有没有一个软件产品,可以搜索文件内容?

  •  
  •   pythonee · 2012-11-17 10:49:03 +08:00 · 3330 次点击
    这是一个创建于 4180 天前的主题,其中的信息可能已经有所发展或是发生改变。
    linux下Grep还能对付一下txt这样的文本文件,但是我想,如果是pdf或是word这样的文件,windows和linux下有什么样的解决办法,我现在的办法就是把一些技术文档都上传的google doc,然后可以用它的搜索
    6 条回复    1970-01-01 08:00:00 +08:00
    fangzhzh
        1
    fangzhzh  
       2012-11-17 11:01:44 +08:00
    grepwin c++ 开源
    http://tools.tortoisesvn.net/grepWin.html
    tortoisesvn作者出品,我在用,性能很强悍。 不差linux下的grep。
    可搜文本文件,office文件,但是貌似pdf是不好用。
    timonwong
        2
    timonwong  
       2012-11-17 11:37:19 +08:00
    PowerGREP
    http://www.powergrep.com/
    支持Word, PDF, 相当贵
    clino
        3
    clino  
       2012-11-17 11:38:18 +08:00
    windows 可以用google桌面搜索或者baidu桌面搜索

    我之前在windows下一直用baidu桌面搜索,因为可以搜索Lotus Notes里的邮件
    pythonee
        4
    pythonee  
    OP
       2012-11-17 13:40:15 +08:00
    多谢前面的回答

    另外问问,有人用过solr来做这个的吗
    pythonee
        5
    pythonee  
    OP
       2012-11-17 13:40:58 +08:00
    @fangzhzh 我的电子书,pdf居多,所以,那个对pdf friendly,我就使用哪个
    fzcs
        6
    fzcs  
       2012-11-17 14:30:19 +08:00
    @pythonee 可以用apache tika 抽取文件的文本内容,然后用solr做检索引擎。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1198 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 23:21 · PVG 07:21 · LAX 16:21 · JFK 19:21
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.