用机器学习预测薪水

2015-07-30 15:57:52 +08:00
 wh0syourda66y

互联网薪水预测

先保证安装了必要的软件库

git clone https://github.com/origingod/salary-prediction-with-machine-learning
pip install -r requirements.txt

首先,先抓取数据,目前我的记录是抓取了10w条,大概有100w~500w条记录

前置性能优化:

$ redis-server
$ celery -A Tasks worker --loglevel=info

运行

python DataCrawer.py

会在目录下面生成一个带时间标识的csv文件

接下来,生成数据训练集

运行

python DataAnalyser.py

上一步会自动处理数据并生成一个预测子名为clf.pkl存放于当前目录,看到clf知道怎么用的都不用说了吧,接下来主要调准精度。

训练模式 输入:

最后

预测模式 输入:

输出:

链接: https://github.com/origingod/salary-prediction-with-machine-learning 可以友情加Star~

5667 次点击
所在节点    Python
21 条回复
hitmanx
2015-07-30 16:06:02 +08:00
数据是从哪里抓取的?
wh0syourda66y
2015-07-30 16:08:28 +08:00
@hitmanx 爬了拉勾的数据,不好直接贴出来哈
scream7
2015-07-30 16:19:33 +08:00
找了好久发现是逻辑斯蒂回归,可以试试SVM等其他的比较下
wh0syourda66y
2015-07-30 16:28:54 +08:00
@scream7 是RBM+Logistic 回归
julyclyde
2015-07-30 17:40:53 +08:00
看到Celery觉得好亲切。最近正在玩Sentry呐
wh0syourda66y
2015-07-30 18:03:07 +08:00
@julyclyde 然而跟Celery没什么关系,只是拿来当任务队列而已
wudikua
2015-07-30 21:03:02 +08:00
能分享一下预测完的结论么
mahone3297
2015-07-30 21:35:30 +08:00
拉钩的数据,会不会不准?不是都说是偏高的么?
TakanashiAzusa
2015-07-30 21:37:06 +08:00
拉勾的普遍偏高。。。
pp3182429
2015-07-30 21:56:15 +08:00
用机器学习聚类萌妹纸
https://github.com/albin3/black-and-white-photo
==#
wh0syourda66y
2015-07-30 23:01:01 +08:00
@pp3182429 乱入了。。
bbking
2015-07-30 23:33:00 +08:00
lz可以说一下思路不?
wh0syourda66y
2015-07-31 00:10:21 +08:00
@bbking 数据获取——数据整理——持久化——数据分割——(建模&调优的循环)——出成果
pp3182429
2015-07-31 10:10:30 +08:00
@wh0syourda66y 哈哈~
pp3182429
2015-07-31 10:11:10 +08:00
@wh0syourda66y 楼主建模用的是函数拟合么?
wh0syourda66y
2015-08-03 10:48:52 +08:00
@pp3182429 恩,比较粗糙,你有兴趣的话,把参数调少一点跑一跑。
yhxx
2015-08-06 21:31:19 +08:00
不管输入什么都是15K?
freezhan
2015-08-06 21:49:32 +08:00
@yhxx 真输入自己的简历只有 11K (比实际的高...) 乱输入的都是 15k, 哭瞎~
wh0syourda66y
2015-08-06 21:50:34 +08:00
@freezhan 摸头,不哭不哭
wh0syourda66y
2015-08-06 21:51:20 +08:00
@freezhan 对了可以跳槽了。哈哈

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/209589

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX