V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
dtgxx
V2EX  ›  问与答

如何确定域名是上海的网站?

  •  
  •   dtgxx · 2022-04-01 11:13:05 +08:00 · 1559 次点击
    这是一个创建于 748 天前的主题,其中的信息可能已经有所发展或是发生改变。
    手里有几千万域名,如何能筛选出来哪些域名是上海的网站?有啥好办法呢。 跑 icp 太久太费钱,写请求访问的话,不知道咋能确定网站信息是北京。。。有啥好办法吗?比如根据后缀等。。。
    12 条回复    2022-04-02 09:23:47 +08:00
    villivateur
        1
    villivateur  
       2022-04-01 11:21:44 +08:00   ❤️ 1
    如果要精确的话,肯定得人工核对。
    你可以尝试爬主页,然后匹配关键词等。
    然后再结合 DNS 解析记录进一步分析。
    oh
        2
    oh  
       2022-04-01 11:30:25 +08:00   ❤️ 1
    爬首页,找关键词:沪 ICP 备
    yaott2020
        3
    yaott2020  
       2022-04-01 12:19:18 +08:00 via Android
    域名还分城市吗
    Showfom
        4
    Showfom  
       2022-04-01 13:54:16 +08:00
    @yaott2020 #3 他应该说的是备案
    haimall
        5
    haimall  
       2022-04-01 14:33:09 +08:00 via Android
    好像没什么关联吧,景安的服务器,浙江的备案,人在上海,内容是论坛。
    dtgxx
        6
    dtgxx  
    OP
       2022-04-01 16:06:40 +08:00
    @haimall #5 肯定有误报,但是只要有确定的,就是收获呀。
    dtgxx
        7
    dtgxx  
    OP
       2022-04-01 16:07:03 +08:00
    @yaott2020 #3
    @Showfom #4 对的 备案,或者网站归属 各种维度划分到某城市 也可以
    yaott2020
        8
    yaott2020  
       2022-04-01 17:01:54 +08:00 via Android
    2 楼方法估计可行
    dtgxx
        9
    dtgxx  
    OP
       2022-04-01 17:14:46 +08:00
    @yaott2020 #8 是 是个好思路 准备试试,类似 banner 、body 、cert 等都能提一些东西
    ik
        10
    ik  
       2022-04-01 22:22:58 +08:00 via iPhone
    既然只是查备案,直接用查备案的 api 呗
    dtgxx
        11
    dtgxx  
    OP
       2022-04-02 01:54:25 +08:00
    @ik 海量没法搞
    cominghome
        12
    cominghome  
       2022-04-02 09:23:47 +08:00
    感觉是伪需求,什么叫“域名是上海的网站”??服务器 IP ?备案?还是公司办公地点?而且服务器 ip 、ICP 备案这些都有一定的“偏差”。

    盲猜想做精准投放一类的操作?大可不必这样吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1570 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 17:00 · PVG 01:00 · LAX 10:00 · JFK 13:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.