如何爬取淘宝商品图片

326 天前
 shawnleo

想通过淘宝商品图构建一个数据集,直接用 selenium 爬会被封 ip 吗?大家有啥好办法吗?

2961 次点击
所在节点    程序员
24 条回复
xieqiqiang00
326 天前
不可能的,别想了
shawnleo
326 天前
我看有说用淘宝客 api 的?
asmoker
325 天前
建议咨询梁博 😄
lhbc
325 天前
这两个地址有不少高人,经验丰富,可以去找他们问一下

深圳市坪山区石井街道金田路 200 号
杭州市余杭区临平镇丘山大街 3 号
xiqishow
325 天前
@lhbc #4 里面的人说话都好听
lithiumii
325 天前
啥数量级?几百上千 selenium 没啥问题,拿自己真的在用的帐号登录都行
zictos
325 天前
淘宝联盟 api 应该可以,只要开通了推广的商家应该都可以
bruce0
325 天前
就淘宝那反扒, 基本别想了🐶
caesar
325 天前
现成的电商插件 都有啊 为啥还要自己开发
vus520
325 天前
如果只是做数据集,不用大面积更新的话,难度不大。解决阿爸的律师团队就行。
Sh4ww
325 天前
只是采集图片的话,其实淘宝有很多无风控的接口,可以找找看
opengps
325 天前
电商起家的反扒能力可是第一,你要跟第一较劲,可是个相当难得事情了
LandCruiser
325 天前
@asmoker 梁博就是爬阿里被告的呀
shawnleo
325 天前
是否可以通过淘宝客 api 或者淘宝开放平台获取呢?除了淘宝,其他的像小红书或者亚马逊之类的有可行性吗?
streamrx
325 天前
别想了
tw93
325 天前
面向监狱编程?
akira
325 天前
直接买别人采集好的
li746224
325 天前
可以的,前提有可用 ip 池。
按照我们的经验跑列表接口的话,封控严的时候换一个店铺出一次滑块。用详情接口的话,基本可以不用考虑,10 几次出一个滑块吧。
如果用 rpa 的话,你得有 n 多账号,封控不严,就算出滑块也可以自动划过去。
最后,希望你们公司有牛逼的法务
PVXLL
325 天前
可能会吃牢饭
weeiy
325 天前
吊淘宝正常访问都给你弹验证,你还用脚本去爬他?真送人头啊?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/949909

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX