V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
yaokwok

想输入网址获取整站邮箱号,有这样的网站吗?

  •  
  •   yaokwok · Nov 13, 2018 · 6170 views
    This topic created in 2722 days ago, the information mentioned may be changed or developed.

    想做个网站,输入网址自动爬虫获取整站邮箱号或手机号,不知道目前有没有这样的网站,如果没有的话,你们有没有这样的需求?

    29 replies    2018-11-15 16:12:45 +08:00
    ljspython
        1
    ljspython  
       Nov 13, 2018
    ...牛逼
    codechaser
        2
    codechaser  
       Nov 13, 2018 via Android
    这怎么可能
    hinate
        3
    hinate  
       Nov 13, 2018 via iPhone
    你可以这样想:输入网址直接下载网站的数据库!获取的信息更全更多~
    yaokwok
        4
    yaokwok  
    OP
       Nov 13, 2018
    @codechaser 我知道现在很多大站的反爬虫策略都很强,但是如果先不考虑这些很强的大站,其它站还是可以自动递归每一个有价值的页面的。但从用途来讲,觉得这样可行吗?
    dingdangnao
        5
    dingdangnao  
       Nov 13, 2018
    输入网址直接把服务器 down 下来?
    russiansim
        6
    russiansim  
       Nov 13, 2018 via iPhone
    输入你银行账号,你钱直接到我卡里行不行?
    隐私这个词听过吗?
    你邮箱手机号随便被人想 down 就 down,这样的网站你敢用吗?
    codechaser
        7
    codechaser  
       Nov 13, 2018 via Android
    @yaokwok 注册邮箱这些都属于隐私数据,只有用户自己和数据持有方才能看见。
    whileFalse
        8
    whileFalse  
       Nov 13, 2018
    国外有这样的网站。

    可以找属于同一个公司的人的联系方式。比如输入 google.com ,就会出一堆 google 的邮箱地址和联系人名字,可能还有职位等信息。但是绝对不全,也不能获取诸如 gmail.com 的后缀的邮箱。
    AN3O
        9
    AN3O  
       Nov 13, 2018   ❤️ 1
    chungzhao
        10
    chungzhao  
       Nov 13, 2018
    好奇你这样干嘛???
    o0
        11
    o0  
       Nov 13, 2018
    整站,比如说谷歌还是淘宝呢,要不直接花几个比特币去买之前的酒店数据不是更好。
    ayconanw
        12
    ayconanw  
       Nov 13, 2018
    那我如果输入 google.com
    kimcool
        13
    kimcool  
       Nov 13, 2018
    不知道是表达错了还是我理解错了···先不说数据量问题···你这是直接拿别人数据库呀
    miniliuke
        14
    miniliuke  
       Nov 13, 2018 via Android
    就你聪明系列......
    lzhd24
        15
    lzhd24  
       Nov 13, 2018
    @codechaser 昨天看美剧的时候,发现字幕组邮箱默认直接显示
    huiyadanli
        16
    huiyadanli  
       Nov 13, 2018
    LZ 这里应该说的只是爬页面上存在的手机号、邮箱,用作营销使用吧。。。有些营销工具都有这个功能。。
    用一些在线的爬虫服务也可以做到。。
    nekoneko
        17
    nekoneko  
       Nov 13, 2018
    活着不好?
    yaokwok
        18
    yaokwok  
    OP
       Nov 13, 2018
    @huiyadanli 是的,收集这些主要用于定向营销,不过我确实没仔细考虑到隐私问题
    yaokwok
        19
    yaokwok  
    OP
       Nov 13, 2018
    @ayconanw 获取不到信息。主要获取论坛类,信息类网站
    yaokwok
        20
    yaokwok  
    OP
       Nov 13, 2018
    @codechaser 是的,注册信息只有用户自己和网站能看到,爬虫顶多爬一些公开的,回复的信息
    atx
        21
    atx  
       Nov 13, 2018
    楼主表述可能有问题,我觉得你就是想抓到页面上的能看到邮箱吧,就像某度贴吧里那种留邮箱的吧,这玩意可以直接拿源码正则提取,
    yaokwok
        22
    yaokwok  
    OP
       Nov 13, 2018
    @lc1450 是的 是我的表述问题,大家误解了
    LukeChien
        23
    LukeChien  
       Nov 13, 2018 via Android
    付款二维码生成器!
    honeycomb
        24
    honeycomb  
       Nov 13, 2018 via Android
    @yaokwok 既然是搞定向营销的话,这样更不能帮楼主了
    o0
        25
    o0  
       Nov 13, 2018
    百毒找到的,希望对 lz 有用,『法无禁止即可为』绝对是错误的,等追责那天就 GG 了,哈哈。
    如果网站运营者已经采取了一定的反爬虫措施(黑名单、robots、使用条款等),而爬虫控制者基于经营目的、强行突破网站运营者采取的反爬虫技术措施,并客观导致被抓取网站的正常运行,则大可能构成上述规定所规制的不正当竞争行为。
    《刑法》第二百八十五条规定,违反规定侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,不论情节严重与否,构成非法侵入计算机信息系统罪。
    未经被收集者同意,即使是将合法收集的公民个人信息向他人提供的,也属于《刑法》第二百五十三条之一规定的“提供公民个人信息”,可能构成犯罪。
    yaokwok
        26
    yaokwok  
    OP
       Nov 14, 2018
    @o0 这么说我可能是犯罪捷径提供者 0.0
    killerv
        27
    killerv  
       Nov 14, 2018
    这个节点选择的真好
    u3u
        28
    u3u  
       Nov 15, 2018
    我知道为什么骚扰电话那么多了
    keventseng
        29
    keventseng  
       Nov 15, 2018
    在违法边缘摩擦摩擦~
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1131 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 74ms · UTC 18:10 · PVG 02:10 · LAX 11:10 · JFK 14:10
    ♥ Do have faith in what you're doing.