可以用 selenium 获取一个亚马逊店铺里所有产品的详细信息吗?

2020-04-02 15:49:54 +08:00
 glp664186796

背景: 我们公司是做跨境电商亚马逊的,五个账号,每个账号都在德法意西四个站点开了店铺,有很多产品。我的工作是要搜集各个店铺里合适的产品,把相关信息做成表格,然后发给不同的国家的测评中介。之前都是手动复制粘贴,都是机械劳动。我会使用 Python 和 selenium,所以有个想法,问问大家能不能行。

想法: 用脚本通过店铺的链接进入店铺产品列表页面,点击第一个产品进入详情页,然后从页面获取到标题、价格、asin 等信息,存在 Excel 或者 MySQL 里面。

疑虑: 1.听说亚马逊反爬虫机制很厉害,这个算是爬虫吗?对脚本运行效率没有要求,可以每一步之间强制停一秒。 2.如果能实现的话,只要亚马逊不更改页面布局,后面就不用再维护了吧。

954 次点击
所在节点    问与答
3 条回复
127000
2020-04-02 16:33:40 +08:00
glp664186796
2020-04-03 18:40:20 +08:00
@127000 我今天试了试,自动点下一页的时候,浏览器提示“firefox 正在防御社交网站对您的追踪”。看了下记录,之前的追踪数是 0,只有今天有追踪。这是不是亚马逊的防御机制,可能会封我的 ip ?
127000
2020-04-03 18:57:47 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/658690

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX