又写了一个域名爬虫

2017-01-04 17:08:20 +08:00
 woniu127
爬取的是 2m3m 网站上的域名数据,比较容易爬取,下一步打算爬取抢米网的。另外还写了一个域名检索的程序,可以进行基本的检索,如全字母,全数字,限制长度,数字+字母,包含某个字符以及字符+英文单词,并且加入了查询域名是否已注册的程序。
github:https://github.com/gaokaigithub/2m3m
3795 次点击
所在节点    Python
7 条回复
Sanko
2017-01-04 21:33:23 +08:00
还以为我被盗号了
woniu127
2017-01-05 08:05:34 +08:00
@Sanko 哈哈哈,这么巧
hiboshi
2017-01-05 10:42:18 +08:00
走的人家接口
其实可以拿 whois 信息的
woniu127
2017-01-05 11:41:00 +08:00
@hiboshi 嗯嗯,也写过直接用 whois 的,因为用万网的 api 简单,就直接用了
Viking
2017-01-05 17:14:03 +08:00
好像不错,研究研究
jiuzhe
2017-01-05 17:51:33 +08:00
目的是啥啊? 我有写过一个小网站 miduobao.com ,删除域名在 http://www.miduobao.com/viewdomaindeletedates.php
没理解兄台从 2m3m 抓啥内容,它自己也是从别的地方抓来的数据啊
woniu127
2017-01-05 18:17:32 +08:00
@jiuzhe 抓数据主要用来自己分析,找自己想要的域名

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/332206

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX