关于爬虫接活,我感觉好忧桑……

2019-01-31 11:22:06 +08:00
 XxxxD

事情是这样的,我工作外学了点 python 爬虫,然后在我的淘宝店铺弄了个帮人代爬虫的链接,设置基本价格是 20 元。

然后昨天有个人在淘宝找到我说需要下载德语的发言,就是给我一个 excel 表格,里面总计 114184 个德语单词,然后需要爬取德语的发音,并且以德语词命名+.mp3 。

一开始他提供爬取音频的地址是德语助手,我去瞄了下,有个 api,用的是 base64 加密,好像也不是很难嘛,而且这是我接的第一个活,然后我就说¥ 20就行了,因为我感觉最主要练手嘛,也是第一个,便宜点没事。

然后我测试下载了几个给他听,然后他说长词像人工合成的,让我又换一个网站 dwds.de, 这时候我已经感觉有点不爽了,然后他发了一个红包过来,说润笔费,我压下不爽,然后继续又瞄了下,dwds 有个音频的 api,但是链接有点没规律,不过网页中可以用正则找出音频链接,然后下载,好吧,继续干活,红包我没开,我是想着弄完了再打开,这样对对方比较尊重一点。

然后昨天晚上开着电脑刷的,快 12 点开始刷的,尽量不给网站造成负担吧,然后今天早上过来再筛选了一下。

表格里面是 114184 个单词 然后弄成元组是 114073 个单词,筛选掉重复的 然后爬取到的音频是 113963 个 然后差集一下是 122 个大小写不一样的,我重新刷了 120 个,还有 2 个不知道是什么情况。

Window 中一个文件如果只是大小写不一样会显示覆盖,或者加编号,没办法仅大小写不同的文件存在,哦,其中我还遇到一个问题是删除掉非 mp3 后缀的用 os.remove(), 一直显示文件不存在,试着修改 shell = True 没用,后面是加上了路径才删除掉的。

哦说回正事,就是我弄完之后打开发现润笔费是 3.68 元…… 3.68 …… 3.68 ………我打开都惊呆了好么,我技术也不是很厉害,昨晚弄到差不多 12 点回去睡觉,突然有感前面看到的几个帖子说熬夜接活,突然觉得自己很厉害呢,然而……现在,我感觉我被伤害了……虽然说也学到了一些东西,如果我当时打开了红包,我一定会把这个钱甩还给他,然后取消订单的!!! orz

所以是我接活的方式不对嘛? 你们接爬虫活类似这种可以定价多少啊?? orz

另外再宣传下我出售的东西,看帖子 /t/529151

再另外,码农码农,真的是农呢

766 次点击
所在节点    二手交易
42 条回复
ooee2016
2019-01-31 11:24:34 +08:00
ahahha 这 3.68.。。。
meppy
2019-01-31 11:25:00 +08:00
做好的文件发给他了?那你还发啥帖啊。。。
XxxxD
2019-01-31 11:26:22 +08:00
IMuMa3
2019-01-31 11:26:43 +08:00
真是哥…… 20 块的话我给你介绍一活。朋友找我好几次我都没给他整…
XxxxD
2019-01-31 11:27:16 +08:00
@meppy 发了啊,本来就是淘宝订单啊,而且我都弄完了,到手刀不太道德吧,发帖主要是吐槽,还有问下正常爬虫接活的价位,哦,还有,宣传一下我出的二手
XxxxD
2019-01-31 11:28:09 +08:00
@IMuMa3 谢谢,我已经吸取教训了 Orz
vikeria
2019-01-31 11:28:21 +08:00
20 块...
auhah
2019-01-31 11:28:32 +08:00
20 块。。。兄弟你也太实在了
cheese
2019-01-31 11:29:16 +08:00
......20 块的外包,哦不对,是 23.68 的外包,可以创 V 站最低记录了吧
XxxxD
2019-01-31 11:29:55 +08:00
@auhah 主要是第一次接活嘛,业务不熟,原先弄过的一些爬虫,偶尔也会帮人免费下点东西,算造福人类了
XxxxD
2019-01-31 11:31:10 +08:00
@cheese = =我已经把 3.68 转账给他了,不收我淘宝退给他,所以是 20,3.68 是尊严的问题
icenine
2019-01-31 11:32:53 +08:00
20 块你还不如帮个忙落个人情,完全是作贱自己
chenchangjv
2019-01-31 11:32:54 +08:00
我写个小脚本也要要个一两百,二十块钱何苦难为自己。。。
cheese
2019-01-31 11:34:21 +08:00
@XxxxD #11 23333,太实诚了。他说换网站重爬就该加钱了,这是需求变更。另外,做这种东西服务类东西,阴谋论一点,要对方好评加追评之后再发全部文件。
cheese
2019-01-31 11:35:22 +08:00
@XxxxD #11 关于报价,前期,不太懂的时候,可以用自己小号去问其他提供爬虫服务的。你跟着要价就好了
XxxxD
2019-01-31 11:36:03 +08:00
@Livid 麻烦帮我删除一下上面对话中的图片,地址是 https://i.loli.net/2019/01/31/5c526758720db.jpg ,没注意涉及到个人信息了,抱歉
azoon
2019-01-31 11:37:35 +08:00
一开始定价就低了,20 块。。。我觉得你开个 200 都可以。
XxxxD
2019-01-31 11:37:43 +08:00
@icenine - -作践
@chenchangjv 谢谢,一开始想着是锻炼自己,而且也是第一笔,所以……
XxxxD
2019-01-31 11:38:32 +08:00
@cheese 谢谢,学到了,我晚点开小号问问,另外他说了会收货给我好评……
XxxxD
2019-01-31 11:39:14 +08:00
@azoon 这个是基数,我看爬虫一般基数都比较低,后续看价格然后让对方购买几十上百个这样,1 是吸引客户,2 是方便计算吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/532091

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX