V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  solider245  ›  全部回复第 9 页 / 共 10 页
回复总数  181
1  2  3  4  5  6  7  8  9  10  
2019-08-12 12:01:34 +08:00
回复了 johnwhite 创建的主题 职场话题 外企年薪 80W v.s. 华为年薪 130W
高考结束了,学霸一脸苦恼的拉着我喝酒。
我以为他考砸了,于是安慰道,今年考砸没关系,来年复读一下就好了。
然后学霸说,老弟,你看,北大、清华都来拉我去上学。但是我只能选择其中一所,你说我该去哪所大学?

学霸一说完,我就把啤酒往他头上倒!
“蚂蚁竞走十年了,你清醒一点!”
正在用,但是不知道为什么,一旦开启远程 wsl,就会很卡,不知道有没有和我一样经历的朋友?
2019-08-04 23:48:37 +08:00
回复了 Wicked 创建的主题 问与答 给孩子准备一台电脑, Windows/iOS/ Linux 选哪个比较好?
Linux 吧,这样就不怕孩子沉迷了。要是真的沉迷,说不定就是下一个 Linus 了!
@locoz #40 谢谢你的答复,今天刚看到这种操作
@cherbim #34 我去,还有这种套路啊?我都没遇到过,一般都是 200 或者非 200 的状态码。
看来大家爬取的都是很高端的网站啊。我爬取的一般都是一些表格网站居多。
谢谢你提供的范例,我琢磨和研究下。
感觉上论坛问了之后,发现了以前很多根本没有接触到的东西。又触及到了我的知识盲区了。
@xuanbg #27 让我很尴尬的是,网上几乎所有的教程都没有涉及到这方面。看来是这个问题太简单了
@daozhihun #29 谢谢了,又涨知识了。
@dongyx #25 哦,有点理解了。
比如我有一个要爬取的网站,他的最大页面值等于 1W,但是我并不知道。
如果用 while true 的话,我相当于要依次载入 9999 次,最终到达一万次,然后 10001 次的时候,页面返回的不是 200,然后这个循环就中止了。

用二分的话,速度就要快一点?

可问题是我的目的是爬取,求最大值只是为了让我的爬虫知道要爬多少个页面,这样的话,二分法用在这里,似乎并没有大的作用?除了可以让我的爬虫可以更快的获取网页的数量。

不过感觉可以用来作为前置使用。比如我想爬取一下这个网站,然后我通过二分法,快速知道这个网站大概有多少个页面,这样的话,心里会更有数?
@dongyx #21 你这个好像有点复杂啊,我得消化下。想问下,你这种写法和前面朋友给的 while True 方式相比,有哪些优点吗?
因为 while true 我现在可以理解,而且也可以写出来了。
@dongyx #20 二分查找是什么意思?
@cherbim #14 原来是这个原理,好的,谢谢哈,我按照这个逻辑,尝试一下
@cherbim #11 能大概写个小例子吗?
@xiaoming1992 #10 我其实已经说了,这个设置最大值这块其实我已经会了。
感觉看别人的代码,似乎有三种写法,if/else,try/expect,while ture 这个例子我还真没见过。
@wzwwzw #5 谢谢,我去看下
@xiaoming1992 #2 设置最大值会遇到一种情况,就是以后当网站的页数超过你的最大值时,你的爬虫就要去更新了
@ranleng #4 请问可以稍微写一个例子吗?
2019-07-18 11:40:45 +08:00
回复了 oldbird 创建的主题 Python anaconda 可以绿色安装吗?
绿色安装是什么意思?我现在一直用 docker,想用就启动,不想用就关了。不知道和你说的绿色安装是不是一个意思
1  2  3  4  5  6  7  8  9  10  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2948 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms · UTC 14:06 · PVG 22:06 · LAX 07:06 · JFK 10:06
Developed with CodeLauncher
♥ Do have faith in what you're doing.