V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
jmy
V2EX  ›  问与答

有没有什么技术手段可以通过关键词的筛选,屏蔽网页内部分内容?

  •  
  •   jmy · 2016-07-28 10:57:03 +08:00 · 1760 次点击
    这是一个创建于 2845 天前的主题,其中的信息可能已经有所发展或是发生改变。

    使用微博的过程中,可以通过第三方工具,例如 WeiboX 或者微博付费会员屏蔽关键词的形式,把一些不想看见和参与的内容( 类似“转载”,“投票”等关键词 ) 给规避掉:一方面提升了获得信息的质量,另外让 Timeline 变的更加清晰、减少了处理“垃圾信息”的时间。

    现在想请教大家,有没有专门为浏览器订制的插件,或者 Firefox 的脚本,也可以实现类似的功能,通过关键词的匹配,屏蔽掉部分不想看到的内容。

    • 例如针对网站“知乎”:屏蔽掉“优雅的体验”等关键词的问答。

    自己先在 Chrome 的应用市场上搜索过,只有一个更具关键词和链接屏蔽网站的应用,但是不能满足我的需求。

    RT ,请问有什么方式可以做类似的筛选?

    6 条回复    2016-07-29 16:58:47 +08:00
    Cbdy
        1
    Cbdy  
       2016-07-28 11:02:02 +08:00   ❤️ 1
    油猴子应该可以的吧
    imn1
        2
    imn1  
       2016-07-28 11:11:49 +08:00   ❤️ 1
    自己写个 js 就行了
    不过, css3 selector 已经废弃了 contains 这个函数,估计你要循 xpath 的思路写这个 js ,才能进行内容匹配
    不然就要正则每个 DOM 节点遍历,更麻烦

    document.evaluate(xpath, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue;
    参看 MDN document.evaluate 函数的参数说明
    lyragosa
        3
    lyragosa  
       2016-07-28 11:13:48 +08:00   ❤️ 1
    下等办法是写个脚本,全文搜索网页关键词,然后屏蔽掉父 DOM 或者附近的 DOM 。
    为了保证最好的浏览效果(比如某些网站结构复杂),可能还要对个别网站定制策略。
    并且这个办法肯定会慢。

    上等办法是自己架个 DNS+反代,所有的请求都通过这台机器进行转发,然后在这台机器的反代上写程序来遍历&搜索&过滤&blabla
    sutra
        4
    sutra  
       2016-07-28 12:53:04 +08:00   ❤️ 1
    Stylish 写自定义 CSS 不显示某些特定标签。
    jmy
        5
    jmy  
    OP
       2016-07-29 16:39:54 +08:00
    @Cbdy
    @imn1
    @lyragosa
    @sutra
    伸手党,自己写不了代码,如果有现成的方案的话,可以琢磨一下。
    Cbdy
        6
    Cbdy  
       2016-07-29 16:58:47 +08:00
    @jmy 有一些现成的油猴子脚本,比如新浪屏蔽特定人之类
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2755 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 07:41 · PVG 15:41 · LAX 00:41 · JFK 03:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.