有没有什么技术手段可以通过关键词的筛选,屏蔽网页内部分内容?

2016-07-28 10:57:03 +08:00
 jmy

使用微博的过程中,可以通过第三方工具,例如 WeiboX 或者微博付费会员屏蔽关键词的形式,把一些不想看见和参与的内容( 类似“转载”,“投票”等关键词 ) 给规避掉:一方面提升了获得信息的质量,另外让 Timeline 变的更加清晰、减少了处理“垃圾信息”的时间。

现在想请教大家,有没有专门为浏览器订制的插件,或者 Firefox 的脚本,也可以实现类似的功能,通过关键词的匹配,屏蔽掉部分不想看到的内容。

自己先在 Chrome 的应用市场上搜索过,只有一个更具关键词和链接屏蔽网站的应用,但是不能满足我的需求。

RT ,请问有什么方式可以做类似的筛选?

1763 次点击
所在节点    问与答
6 条回复
Cbdy
2016-07-28 11:02:02 +08:00
油猴子应该可以的吧
imn1
2016-07-28 11:11:49 +08:00
自己写个 js 就行了
不过, css3 selector 已经废弃了 contains 这个函数,估计你要循 xpath 的思路写这个 js ,才能进行内容匹配
不然就要正则每个 DOM 节点遍历,更麻烦

document.evaluate(xpath, document, null, XPathResult.FIRST_ORDERED_NODE_TYPE, null).singleNodeValue;
参看 MDN document.evaluate 函数的参数说明
lyragosa
2016-07-28 11:13:48 +08:00
下等办法是写个脚本,全文搜索网页关键词,然后屏蔽掉父 DOM 或者附近的 DOM 。
为了保证最好的浏览效果(比如某些网站结构复杂),可能还要对个别网站定制策略。
并且这个办法肯定会慢。

上等办法是自己架个 DNS+反代,所有的请求都通过这台机器进行转发,然后在这台机器的反代上写程序来遍历&搜索&过滤&blabla
sutra
2016-07-28 12:53:04 +08:00
Stylish 写自定义 CSS 不显示某些特定标签。
jmy
2016-07-29 16:39:54 +08:00
@Cbdy
@imn1
@lyragosa
@sutra
伸手党,自己写不了代码,如果有现成的方案的话,可以琢磨一下。
Cbdy
2016-07-29 16:58:47 +08:00
@jmy 有一些现成的油猴子脚本,比如新浪屏蔽特定人之类

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/295457

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX