好迷茫啊, Python 该怎么走向中级工程师或者初级

2022-06-04 22:46:48 +08:00
 996bujiaban
用 python ,有两三年了,最近刷 b 站和抖音都有点迷茫了
目前是在公司做爬虫,说是搞爬虫,其实大家都知道,就是堆 ip ,堆机器,堆算力
逆向的,自己能看懂就逆,看不懂就去市场上收接口,或者干脆就是 selenium 堆几个服务器,或者图色冲了
ip 的,虽然搭了采集网上免费的,但是多数也是直接花钱冲
算力是,看验证那部分,用开源的训练,图形,或者语音

现在公司就我和另一个同事在维护了,它负责运维,我负责爬和洗,也是一样的 python
好迷茫,说实话,公司的任务是完成了,

但是没有什么成就,自己兴趣就写了一些游戏签到的脚本,搭了个养号的框架,日常撸羊毛

像是羊毛线报,活动抢购,虽然也写,但是那些放 github 上 也不能自豪的说“大家快来看看”这样

日常也是一边上班一边接私活,虽然活多,但是也没有进步,基本就是爬虫一套撸下来

感觉自己更像一个脚本小子,连初级都不算,项目也是直接抄开源就用

今天看了工作区,虽然有几家收 python ,但是我竟然连工作要求都看不懂...里面提的框架我甚至没用过

然后去搜了中级工程师,什么百万并发流量支撑,说实话,我爬虫,一秒 200 下的频率都很少开,就怕别人网站撑不住或者风控,这差距真的太大了

写的有点乱,网抑云了,大佬轻喷,不知道是不是应该去报个线上培训班什么的看看,或者干脆转语言什么的?
3350 次点击
所在节点    程序员
23 条回复
yunser
2022-06-04 23:25:57 +08:00
不要把自己限死在爬虫领域。
lozzow
2022-06-04 23:36:34 +08:00
试试去破解 ti.com 的下单,搞完就财富自由了
jeeyong
2022-06-04 23:43:19 +08:00
我和你的工作内容差不多... 运气好的是我的"客单价"可能更高...
越来越感觉走不通了...这条路是个死胡同..
实名越来越完善, 大部分服务登录才可以继续使用. 这一点就极大的拉高了爬虫的成本.
试图解决这个问题, 解决的越多你离刑法就越近...

做完手上这个系统, 我就不准备做爬虫相关了..估计能再吃个 2,3 年...然后用这段时间开始转型..

我准备看的方向.
主线: c#和 unity.. 我觉得下一个风口和生产力提升的方向是元宇宙, 至少算一个. 所以看游戏开发这块的知识, 能做最好, 做不了起码懂一些..
说服了一个投资人做元宇宙方向, 目前通过朋友间的了解和市场调研, 发现, 至少能实现短期内产生流水..回笼部分资金.

支线: 有条件继续熟悉了解 js 吧.. 到现在我只能看懂 js, 让我上手写我就懵逼.. 而且基于 webgl 的 3d 也是个低成本尝试的手段..
另外更多的兴趣角度, 想重新捡起来 C/C++看看.
defunct9
2022-06-05 07:01:30 +08:00
求推荐 ip 代理提供商
Donahue
2022-06-05 09:47:31 +08:00
干脆自己开一个培训班 (doge)
anonymous256
2022-06-05 14:28:20 +08:00
不要局限于一个小的方向吧,多关注语言自身的特性和设计,关心更多的编程语言、系统、算法,视野也就更开阔了。
LeeReamond
2022-06-05 14:41:39 +08:00
爬虫的业务本身太单纯了,本质上就是发送 http 请求的字符串,然后处理收回的字符串,文科类大学生经过三个月培训班也能做,所以你的发展潜力仅限业务上而不是技术上。业务上大环境对爬虫不会友好,可以试想一下如果反之的话,你深耕业务就可以很滋润了,不会有类似的疑问。

高并发的问题是你业务上没遇到。以前公司接过一个业务做金融数据实时接口,被调用方不确保服务可用性,失败率大概跟跨国丢包率差不多,峰值时段可能有 20%以上超时请求,在此基础需要封装一个数据强一致且能实时调用的接口。当时在分布式信息一致性和实时分析上下了很大功夫,但是本质上也跟请求本身无关。只能说业务场景还是很影响技术的上下限,建议 LZ 要不然彻底放弃爬虫,要不然找个业务实在的公司
l4ever
2022-06-05 14:58:42 +08:00
求推荐 ip 代理提供商, 目前用的 IP hai(避免广告嫌疑, 中文用拼音了),
感觉还行,但是经常提到重复的代理.
bavtoex
2022-06-05 15:04:35 +08:00
OP 有 tg 联系方式吗?
私活
SmiteChow
2022-06-05 15:21:22 +08:00
不用谦虚,人生就是这样,你以为你是脚本小子,别人眼里你就是天才。
996bujiaban
2022-06-05 19:46:46 +08:00
@jeeyong 谢谢,刚刚有去看了你之前留言的 简历,
看到你有搞快排和 训练验证码,这部分确实很像,
其实我也感觉爬虫不好搞了,特别是国内的,但是一时没什么方向,
你说的如果是币圈的话,我也是在布局了,或者养号吧
支线的话,我也是觉得 js 得继续学,技多不压身嘛
996bujiaban
2022-06-05 19:47:39 +08:00
@yunser 谢谢,但是没什么思路,python ,我目前就知道爬虫,和 ai ,但是我是开源调参侠,ai 实在不行
996bujiaban
2022-06-05 19:48:35 +08:00
@anonymous256 谢谢,会尝试看下的
996bujiaban
2022-06-05 19:49:19 +08:00
@LeeReamond 确实,我也感觉是跟业务有关联,但是 python ,除了爬虫,一下子也不知道去做什么业务了,ai 确实不行的
996bujiaban
2022-06-05 19:49:35 +08:00
@SmiteChow 感谢
cocoakekeyu
2022-06-05 22:29:41 +08:00
github 的地址呢,你觉得一般别人还没做过的呢
jiangzhizhou
2022-06-06 00:15:16 +08:00
@jeeyong
@996bujiaban 爬虫这类业务在海外都算灰产,国内只是法律没来管而已。做小工具问题不大,Python 确实很适合做小项目自己玩。PY 也可面向对象做框架,和其他语言其实差别没那么大。
高并发这类业务在海外云都给你解决好了,一般也不需要自己来搞。做同样的事情,大学生创业,小公司,百亿级,千亿级,万亿级别的公司需要的完全是不同的技术和业务能力。
我一直觉得,沟通理解能力比技术能力要重要。(实在不知道学什么就学雅思托福)
工作中能提出解决这个问题的方案比拿着技术证书讨一份工要好很多。
codefun666
2022-06-06 09:56:21 +08:00
Python 和 C++混合使用。Python 是 wrapper ,虽然开发效率高,但性能还是差太多。
chendajun
2022-06-06 11:20:11 +08:00
情况一模一样:同样是 python 写爬虫,普通的爬虫用 scrapy ,需要登录验证的就定制开发。辞职后突然不知道方向了。其实自己反思一下最重要的是基本功不扎实,深度不够。
wersonliu9527
2022-06-06 16:27:40 +08:00
四非(二本非计算机专业)转 python ,python 工作第四年。之前都是爬虫,难的 js(瑞数,极验),app(抖音小红书)搞不了,四月份换工作了虽然薪资 30%,但是工作内容主要 pandas ,numpy 处理下数据。感觉前途渺茫

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/857305

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX