写了个爬虫登录知乎和 Bilibili 网站,求教验证码识别

2016-09-19 09:15:59 +08:00
 newhotter

是利用 Selenium 写的。 想装逼但是装的不是很畅快,因为不好识别验证码。具体的可以看利用 Selenium 来实现知乎和 Bilibili 的登录,求给点建议。 这是 Bilibili 的登录代码。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
from selenium import webdriver
import time

browser = webdriver.Chrome()
browser.get('https://passport.bilibili.com/login')

browser.find_element_by_name("userid").send_keys("input_your_userid")
browser.find_element_by_name("pwd").send_keys("input_your_password")
time.sleep(10)
#browser.find_element_by_xpath("/html/body/div[3]/div/div[2]/div[3]/form").submit()
browser.find_element_by_xpath("/html/body/div[3]/div/div[2]/div[3]/form/input[4]").submit()
9570 次点击
所在节点    Python
33 条回复
ookcode
2016-09-19 14:23:18 +08:00
@Geoion 23333 ,我服
newhotter
2016-09-19 14:26:21 +08:00
@Geoion 哈哈哈哈哈。服气。。。这两天充分利用一下这个 bug 。。
EyreFree
2016-09-19 14:28:45 +08:00
@Geoion 666666
azuginnen
2016-09-19 14:32:42 +08:00
哈哈,真的是 b 站的呀


Block
Geoion
bilibili.com
V2EX 第 126853 号会员,加入于 2015-07-13 01:17:19 +08:00 ,今日活跃度排名 1238
42 S 97 B
Geoion
2016-09-19 14:47:14 +08:00
@azuginnen 是 B 站,不过不是直播部门
Geoion
2016-09-19 16:07:27 +08:00
@smileghost 哈哈,知会一下负责这个的部门而已
iannil
2016-09-19 16:09:56 +08:00
在全球工单系统不能乱说话,各厂的人都有
Srar
2016-09-19 18:38:40 +08:00
我一个同群朋友用机器学习写了一个 bilibili 验证码识别 https://github.com/bilibiliHack/bilibiliCaptcha
xiao201261
2016-09-19 19:12:50 +08:00
bilibili 有些登录 page 并不需要验证码。。
liuxu
2016-09-19 19:27:49 +08:00
@Geoion 斗智斗勇 233
newhotter
2016-09-19 20:39:32 +08:00
@Srar 厉害啊! star 了
fleer
2016-09-20 01:08:19 +08:00
@Geoion 我也说个吧, av10492 不需要登录验证,也就是一些会员才能观看的页面不需要验证,我懒得输验证码就回去 10492,,Ծ^Ծ,,
figofuture
2016-09-20 14:38:05 +08:00
mark

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/307148

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX