做了个在线中文简历解析

2015-11-20 11:30:46 +08:00
 arcadia
http://youyun.com
自比业内第一,欢迎大家指正!
5861 次点击
所在节点    分享创造
14 条回复
996635
2015-11-20 11:36:05 +08:00
关于 HTML 解析这一块,你是怎么处理的? 重渲染么?
arcadia
2015-11-20 12:01:22 +08:00
@996635 不解析 HTML 代码,去掉之后按纯文本统一处理
arcadia
2015-11-20 12:13:15 +08:00

刚刚搞明白怎么贴图
kevin1452
2015-11-20 13:13:23 +08:00
- -这个......
接收到足够多的简历人看不过来的估计都有自己的挖掘系统
小公司估计 hr 可以 hold 住

我就一说..
easychen
2015-11-20 14:37:56 +08:00
顺便找了份简历测试了下,效果一般。有两段工作经历没有切开。

如果扔掉结构分析纯文本的话,主要就看字段规则库和行业词库。加上自学习基本能帮人做第一遍分析。
我们之前有个分析 dom 树来算区块文字权重的算法,效果还不错。 后来发现实际业务基本用不到这个功能就没改进了……
finian
2015-11-20 15:08:47 +08:00
围观域名
chenyr99
2015-11-20 18:59:28 +08:00
试了几个,还行。
powtop
2015-11-20 19:09:50 +08:00
这域名 可以
unknownservice
2015-11-20 19:26:57 +08:00
拿手边的一份试了一下, 21 个字段只解析出 6 个...
tequila713
2015-11-22 11:29:45 +08:00
@arcadia 噗 楼主是 didit 哪位?
hqs123
2015-11-23 07:33:33 +08:00
不错,支持分享
arcadia
2015-11-23 17:09:37 +08:00
@kevin1452 是的,如果简历多,并且源头比较固定,可以开发自己的挖掘系统。但是当简历的来源比较多的适合,简历的格式比较复杂适合,开发自己的挖掘系统就不是很划算了。
arcadia
2015-11-23 17:12:48 +08:00
@unknownservice 现在,解析的内容是大部分简历中常见的信息,并且这些字段对评价简历的质量比较重要,会有部分内容现在不支持解析,欢迎提供意见
kandy
2018-09-18 14:01:17 +08:00
差距很明显呀

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/237572

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX