首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python 学习手册
Python Cookbook
Python 基础教程
Python Sites
PyPI - Python Package Index
http://www.simple-is-better.com/
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
华为云
V2EX  ›  Python

有人做过模拟淘宝登录吗?

  •  
  •   caibou · 66 天前 · 3895 次点击
    这是一个创建于 66 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有人做过模拟淘宝登录吗?最近想模拟登录淘宝联盟, 抓取订单信息,但是一直卡在登录这块。

    我用 selenium + chromedriver 模拟登录操作, 但是每次都会显示验证码滑块, 模拟滑块滑过去的操作,就一直提示错误,要我刷新。一直卡在这个步骤。即便我用鼠标自己去操作滑块,也仍然会提示我出现错误,要我刷新。

    但是如果我用浏览器正常打开,是不会有滑块出现的。

    我觉得是 selenium + chromedriver 一开始进入网页就被识别成爬虫了。

    有没有大佬有解决方案

    第 1 条附言  ·  28 天前
    解决了。 思路是手机请求二维码下来, 然后 xposed 去 hook 淘宝自动扫码
    29 回复  |  直到 2018-10-27 17:23:37 +08:00
        1
    murmur   66 天前   ♥ 2
    这个知乎上有讨论
    从爆栈网上其他人的答案来看 淘宝的却会检查自动化防范
    比如识别$cdc_asdjflasutopfhvcZLmcfl_、webdriver 这些关键字
    参考 https://stackoverflow.com/questions/33225947/can-a-website-detect-when-you-are-using-selenium-with-chromedriver
    这个 cdc 我以为是个乱码 看上去就是这么检测的
        2
    bmos   66 天前
    上次看到一个帖子,网站也是用了 webdriver 关键字屏蔽,好像需要自己修改后再编译才能去除。
        3
    golmic   66 天前
    提供基于 http/s 请求的淘宝、天猫、支付宝登录方案,requests 实现,可用于生产环境
        4
    kimqcn   66 天前
    笨,登陆的时候用 Autoit 啊,进去了再用 selenium.
        5
    xyfan   66 天前
    别说模拟登陆,我正常登陆都登陆不上去,过不去滑块验证,不知道怎么就把我识别为机器人了。
        6
    caibou   66 天前
    @xyfan 正常登录可以呀, 我正常打开 chrome 一切正常。
        7
    imn1   66 天前
    @xyfan +1
    me2,虚拟机 ie 进不去,但 host(linux) chromium 则可以
        8
    qwertty01   65 天前
    @kimqcn 既然登录可以检测,你使用 selenium 一样可以检测,治标不治本。
        9
    xyfan   65 天前 via Android
    @caibou 肯定大部分人都可以正常登录,但是我手动都登录不上去,淘宝的验证方法肯定是有些问题。
        10
    dcatfly   65 天前
    改一下浏览器头?不太确定这个原理。另外推荐 Puppeteer。
        11
    beforeuwait   65 天前
    4 楼靠谱
    slenium 一进去就被识别为爬虫了,过不了的。
        12
    shapl   65 天前
    直接调订单接口就是了。。。百度搜一下 taobao.tbk.sc.order.get
        13
    caibou   65 天前
    @shapl 这个要拥有高级权限才可以调用, 行不通的
        14
    nilrust   65 天前
    反正最简单的浏览器油猴脚本完全可以解决需求。
        15
    shapl   65 天前
    @caibou #13 搜一下再说。
        16
    caibou   65 天前
    @shapl 兄弟有什么直说呀, 官方这个 api 是要有高级权限才提供的
        17
    sujin190   65 天前
    而且以前似乎登录一次,你只要一直刷新,接近于使用,几乎不会掉出去,但是现在似乎有事没事踢出去,过几分钟就得重新登录一次,烦人的很
        18
    realkenshinji   65 天前
    除了这个,我记得以前还要你从下面的图片里选出你曾经购买过的物品....
        19
    jccg90   65 天前
    之前做过,登录部分要手动过验证,自动化总是出问题。。。然后加个微信告警通知,需要登录的时候提醒我连上去登录一下。。。
        20
    caibou   65 天前
    @sujin190
    @realkenshinji
    @jccg90
    我目前在淘宝联盟的订单抓取, 但是 50 分钟登录状态就过期了。 不知道有没有什么好方法。
    手动扫码登录肯定是不行的, 不可能人工 24 小时都在扫
        21
    sujin190   65 天前
    @caibou #20 不知道用按键精灵之类的模拟鼠标点点点,能不能保持住登录状态
        22
    Luxurious   65 天前
    现在登录必须得选择已经购买的商品才行吧
        23
    JasperYanky   65 天前
    1.挂阿里旺旺获取 ie 里面的插件拿 cookie
    2.调用订单接口,目前工具商已经有部分不完美的接口放出
    3.把我加入特别关注
        24
    SpiderXiantang   65 天前
    我登上去过 selenium 用的微博账号
        25
    SpiderXiantang   65 天前
    会跳滑块 但是能登陆 是个淘宝的小问题吧
        26
    caibou   65 天前
    @sujin190 不行, 我试过了,50 分钟之后必定要重新登录
        27
    caibou   64 天前
    @JasperYanky 你指的是 window 版的阿里旺旺吗
        28
    JasperYanky   64 天前
    @caibou 是的,阿里旺旺会往 ie 里面插快捷登录
        29
    fantasyni   20 天前
    xposed 去 hook 淘宝自动扫码 怎么弄的?
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1909 人在线   最高记录 3821   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.1 · 22ms · UTC 02:09 · PVG 10:09 · LAX 18:09 · JFK 21:09
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1