首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  axwz88  ›  全部回复第 1 页 / 共 3 页
回复总数  51
1  2  3  
@maomaomao001 你这逻辑不就像女人被猥亵怪她穿的太性感吗,本身别人网站条约里写明不让爬虫爬,有人爬自然是非法访问,相比于靠法律制约还是想怎么反爬来的实在
6 天前
回复了 easonwu 创建的主题 问与答 求爬虫抓取人才,能抓 dy 的那种!
为什么 v 站这么多奇葩嘛,连问题都说不清楚的都上首页了
感谢大家
每条回复我都认真看了,的确解决问题的方式不止一种,综合大家的回复我考虑用 ac 自动机去实现
@aguesuka
@nevin47
@wmc
@no1xsyzy

感谢,用 ac 自动机可以高效实现,trie 树和 kmp 算法实现 ac 自动机,用 hashtable 对字符串碰撞也可以实现,受教了,没想到自己这么菜
@OhYee
@RicardoY
@Enya
感谢回复,截断的确是个最直接的方法,但很多学校名称不规则,比如"XX 集团 XX 所",还有些大学有注释,比如"中国石油大学(华东)",所以这种办法就行不通了。
计科路更广一点
28 天前
回复了 alanlian 创建的主题 数据库 华师大数据库方向研究生??
楼上怼的好,很多像楼主这种不愿意多打两个字的自己说给自己听,华师是哪个华师,同理还有西大
分母+1
@november 用浏览器又不是意味着经常会用插件,很多人只是用浏览器功能而已
楼上的什么鬼逻辑,会用 chrome 的都会 fq,莫名有点搞笑
@annoy1309 他说对软件更感兴趣,他现在的专业也和硬件沾边所以也学过一点理论基础,他更想走软件
@knowckx 感谢回复,我也想推荐大数据方向,还有更多选项吗
几十万并发,楼主你是认真的吗
52 天前
回复了 masonvip 创建的主题 Apple 有哪些软件让你觉得越来越差
@NerverLibis 我觉得你应该换个手机
75 天前
回复了 harley27 创建的主题 Java Java 做爬虫有没有什么比较牛的地方?
python 写爬虫好处是工作量小,轮子也多,用 java 写爬虫和 python 实现的没太大区别,很多搜索引擎爬数据量特别大还要追求速度的用 c 和 c++写爬虫
76 天前
回复了 axwz88 创建的主题 问与答 这个域名真的是学费么
@wunonglin

@WebKit
如果只是考虑好记这个因素,那非主流域名好记又能注册的太多了
76 天前
回复了 axwz88 创建的主题 问与答 这个域名真的是学费么
@icy37785
@ZRS
既然是用来建站当然是考虑用户使用呀,因为我自己不好参考所以才有了这个主题的提问
1  2  3  
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   4226 人在线   最高记录 5043   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.3 · 35ms · UTC 06:50 · PVG 14:50 · LAX 23:50 · JFK 02:50
♥ Do have faith in what you're doing.