一个关于亚马逊爬虫的问题,如何看整个亚马逊的商品

2021-05-20 16:01:14 +08:00
 kerwenard

想要爬取亚马逊美国站的所有商品,但是没有途径

临时的解决办法是按照他的目录爬取,但是这样有一个问题,每一个最低级目录智能显示前 7 页的商品,按照价格最高排列和最低排列页只能获取 14 页的商品,超过 14 页的就抓不到了,这种应该怎么整呢

2527 次点击
所在节点    Python
9 条回复
RockShake
2021-05-20 16:59:30 +08:00
对速度没有要求就 selenium 大法吧
kerwenard
2021-05-20 17:12:39 +08:00
@RockShake 现在是已经可以爬取到商品,但是如果想要爬取全站的商品,没有途径可以爬
chenzheyu
2021-05-20 19:30:56 +08:00
你们有什么爬的,我的 curl 直接就被识别成爬虫
Skmgo
2021-05-21 02:06:42 +08:00
@kerwenard 很简单,你注册个联盟会员 affiliate,然后就有接口不需要用蛮力爬.
kerwenard
2021-05-21 10:01:29 +08:00
@chenzheyu 你有没有添加浏览器标识头那个
kerwenard
2021-05-21 10:01:45 +08:00
@Skmgo 有网址吗
kerwenard
2021-05-21 10:02:06 +08:00
@chenzheyu 'USER_AGENT': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'
xrkorz
364 天前
大佬,你好,我是查询你的 ID 来到这里的,我在这个帖子下面看到你的发言,不知道你现在是否已经解决这个问题了。https://answers.microsoft.com/zh-hans/windows/forum/all/%E5%85%B3%E4%BA%8E%E8%BE%93%E5%85%A5%E6%B3%95/5411865a-2a25-469b-86be-3643ff34749e
我同样遇到了这个问题,我已经找到了解决方案,
"HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Keyboard Layout"
把值设置为 1 就可以了
xrkorz
364 天前
@xrkorz 还是不行,一开始设置后没有,后面又有了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/778166

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX