我有个紧急的一次性扫描项目需要外包,有人可以接私活吗?项目需求很紧,工作量不大。

2018 年 4 月 22 日
 inksong

我有 3500 个网站的顶级域名,现在需要获取每个 website 内的全部子 url,并爬取子 url 内的 html 文字信息。

举例来说,以 www.giftofwings.com 为例子: 得到一堆类似于 http://www.giftofwings.com/cgi-bin/SoftCart.exe/cam.html?L+mystore1+bkcm8438ffb2f5b2+1507421651 http://giftofwings.com/specials.html 的 url,注意这里不要.js 和.css 等,只要页面。 拿到这个 list 后在做一个简单的 html 爬取,最后提交的是这些 html 的源码,只要文字信息,不爬任何多媒体,所以应该比较快。

详讯麻花腾:腰腰霸腰霸叁叁玲叁伍 null。

7657 次点击
所在节点    Python
22 条回复
hourann
2018 年 4 月 22 日
没法保证爬干净吧?
zuoakang
2018 年 4 月 22 日
上价格呗
xgzxy
2018 年 4 月 22 日
@inksong 你做过爬虫吗?
Leigg
2018 年 4 月 22 日
腰霸好评
gdtv
2018 年 4 月 22 日
假如这 3 千多个网站没有任何防爬虫措施,并且这 3 千多个网站服务器性能扛得住爬虫,那么的确挺简单的。
sunsh2017
2018 年 4 月 22 日
报价格。
KKKKKK
2018 年 4 月 22 日
我的需求只有一个,news.qq.com ,只爬文字,不需要多媒体,应该挺简单的,所以比较快。急
exalex
2018 年 4 月 22 日
急 预算 200 块 需求很简单 最多几小时的事情。

楼主大概就这意思
exalex
2018 年 4 月 22 日
有个不是很紧急的少量页面的项目需要外包,有人可以接私活吗?项目需求不算很紧,工作量很小。
inksong • 53 天前

我有个紧急的一次性 mapreduce 项目需要外包,有人可以接私活吗?项目需求很紧,工作量很小。
inksong • 80 天前

我有个紧急的一次性爬虫项目需要外包,有人可以接私活吗?项目需求很紧,工作量很小。
inksong • 88 天前

戏精?已 block
murmur
2018 年 4 月 22 日
@exalex 工作量很小
厉害厉害
wenzhoou
2018 年 4 月 22 日
这是在测试自己的自动灌水机啊。
stzz
2018 年 4 月 22 日
好奇这人干嘛的…
jingrui
2018 年 4 月 22 日
15w,3 天,还有惊喜,愿意私信
summerwar
2018 年 4 月 22 日
标题中,倒数第二句和倒数第一句内容冲突
zwzmzd
2018 年 4 月 22 日
@stzz 不出意料就是贩子,淘宝上接了单,转包给 v 友
missdeer
2018 年 4 月 22 日
@stzz
@zwzmzd
估计就是外包中介,赚中间差价
huluhulu
2018 年 4 月 22 日
我正好有全套代码……只需要输入域名即可,10 万,2 天
imkerberos
2018 年 4 月 22 日
我正好有全套写好的代码. 连 SERVER + Browser 界面. 10 万, 同楼上 2 天.
DeWhite
2018 年 4 月 22 日
楼上这个价格合理
Leigg
2018 年 4 月 23 日
@exalex 我联系了他,说价格上 k,估计被吓到了,直接不理人了。。我也是醉了,自称一个博士给人干活,就这尿性。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/448842

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX