yxwzyyk's recent timeline updates
yxwzyyk

yxwzyyk

V2EX member #118179, joined on 2015-05-22 09:04:38 +08:00
yxwzyyk's recent replies
Dec 15, 2018
Replied to a topic by yxwzyyk 站长 话说现在网盘搜索站还有的玩吗?
@soho176 😂爬虫是最乱的一块代码了不好意思给人看,全文查找这东西 elasticsearch 了解一下,中文分词加上拼音分词自定义词典以及繁体简体转换,基本就能做到了
Dec 14, 2018
Replied to a topic by yxwzyyk 站长 话说现在网盘搜索站还有的玩吗?
@soho176 哈哈你想学习啥,服务器? 爬虫? 全文查找?
Dec 13, 2018
Replied to a topic by yxwzyyk 站长 话说现在网盘搜索站还有的玩吗?
@sarlanori 别的网盘也会有😂因为才开始所以还没来得及去爬取别的网盘的资源
Dec 13, 2018
Replied to a topic by yxwzyyk 站长 话说现在网盘搜索站还有的玩吗?
@sarlanori 这个怎么说呢,这个算定制搜索吧
Dec 13, 2018
Replied to a topic by yxwzyyk 站长 话说现在网盘搜索站还有的玩吗?
@syl9617016 😂要感谢虫部落
Dec 13, 2018
Replied to a topic by yxwzyyk 站长 话说现在网盘搜索站还有的玩吗?
@allen2012 哈哈喜欢就好
Dec 13, 2018
Replied to a topic by yxwzyyk 站长 话说现在网盘搜索站还有的玩吗?
@mon3 URL 就是 uuid 了, 相关资源用的是 elasticsearch, tag 是我用来作为一种可拓展的分类手段
Dec 12, 2018
Replied to a topic by yxwzyyk 站长 话说现在网盘搜索站还有的玩吗?
@Cosinex 有些新的很快就会失效,服务器有检查到就会删除
Dec 12, 2018
Replied to a topic by yxwzyyk 站长 话说现在网盘搜索站还有的玩吗?
@MonsterTan 并没有开源,这东西不是都那一套吗?python 写好规则爬取和提交,接着部署到各个地方,服务器负责数据过滤和整理,然后 es 进行搜索,几个定时任务负责定期扫描去掉失效链接
Dec 12, 2018
Replied to a topic by yxwzyyk 站长 话说现在网盘搜索站还有的玩吗?
@zoola 应该泛指了很多敏感词吧,不该出现的东西
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2774 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 10:25 · PVG 18:25 · LAX 03:25 · JFK 06:25
♥ Do have faith in what you're doing.