V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wyy  ›  全部回复第 1 页 / 共 1 页
回复总数  16
你从 19 年离职后至今都没工作么?
得多云多活把?
出故障后才迁移,先不说你自己的服务和数据能不能快速迁移走,你想迁到哪,对方也得有相应的资源能快速提供出来把
2019-04-17 12:51:01 +08:00
回复了 Kathymomo 创建的主题 酷工作 [校招] [女士优先] IT 运维工程师
女士优先的出发点是啥?
2019-04-16 23:03:24 +08:00
回复了 powersee 创建的主题 互联网 第一次百度到油管的内容
百度应该是可以爬取油管的结果的吧,只是放到检索结果中,大家访问不了,也没啥意义,所以一般不会放吧
2019-03-20 23:32:25 +08:00
回复了 rebooter 创建的主题 分享发现 百度图片搜索竟然有全屏广告模式
啥都愿意喷啊
从产品的角度看这个还是比较合理的啊
2019-01-03 21:22:10 +08:00
回复了 wyy 创建的主题 Kafka kafka 的 mirror maker 后台启动后获取进程号
目前看通过 jps -m,可以找到
再问下:jps 依赖 tmp 目录吗? jps 会因为 tmp 目录内容丢失导致找不到 jps 进程吗
2019-01-03 21:20:50 +08:00
回复了 szzhiyang 创建的主题 程序员 最好的编程语言是什么?
汉语
2018-09-19 10:58:47 +08:00
回复了 ftu 创建的主题 Apple iOS12 使用时间多出了 安心点??求大神分析
这个和苹果 ios12 beta 版的某个疑似 bug 有关
估计是有什么故障,我这里用美国和日本代理,都没有复现你说的这个问题
你没改自己的 Headers 吧?
2018-03-17 18:59:11 +08:00
回复了 kvenux 创建的主题 职场话题 新加坡博后 国内互联网怎么选 求分析
去了互联网,可能去不了新加坡了
从新加坡回来,还有机会去互联网
2018-03-17 13:14:05 +08:00
回复了 wyy 创建的主题 Python Python 多线程爬虫停止条件
@lynskylate task 是一个线程池,深度和 url 存在 task 里是什么意思
2018-03-16 18:01:14 +08:00
回复了 wyy 创建的主题 Python Python 多线程爬虫停止条件
@sunchen 谢谢
2018-03-16 17:51:06 +08:00
回复了 wyy 创建的主题 Python Python 多线程爬虫停止条件
@sunchen 谢谢~刚想到了您的这种解决方案。python 里如果想效率高一些,url 去重用 url 做 md5 hash 放到 set 里; url 存储用什么方式呢?
2018-03-16 17:34:13 +08:00
回复了 wyy 创建的主题 Python Python 多线程爬虫停止条件
@scriptB0y 如果我抓 2 层,那就是抓主页里的所有 url,然后这些 url 页面里的 url 再取出来抓下来,这个过程中 url 不断入队,我如何判断在什么地方停止呢?
2018-03-15 11:11:21 +08:00
回复了 wyy 创建的主题 Python Python 爬虫中怎么讲 url 地址转义为文件名?
@julyclyde windows 系统中合法的文件名
2018-03-15 11:10:48 +08:00
回复了 wyy 创建的主题 Python Python 爬虫中怎么讲 url 地址转义为文件名?
urllib 中的 urlencode 就可以了,注意要用字典的形式作为输入 value
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5450 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 07:55 · PVG 15:55 · LAX 00:55 · JFK 03:55
Developed with CodeLauncher
♥ Do have faith in what you're doing.