正在做简历解析引擎,请帮忙测试

2015-09-02 10:04:59 +08:00
 xunyu
正在做 word 和 pdf 格式的简历解析引擎,现阶段框架完成,但数据集不完善,可能无法正确识别公司名等特征,请大家帮忙测试下,地址在 61.153.100.42 ,谢谢
6044 次点击
所在节点    分享创造
31 条回复
BikeMan
2015-09-02 10:50:23 +08:00
现在的 HR 这么厉害了, 用这种方式骗简历了.
xunyu
2015-09-02 11:06:10 +08:00
@BikeMan 我不是 hr ,只是在做 nlp 相关的工作,简历的隐私对我不重要,只想测试公司,职位还有相关信息能否正确识别,调整模型,谢谢
c742435
2015-09-02 11:19:16 +08:00
看起来很屌。为何不抓简历呢
codeforlife
2015-09-02 11:24:40 +08:00
简历的隐私对你不重要人家也不可能就这么发给你啊
xunyu
2015-09-02 11:35:54 +08:00
@c742435 抓简历没啥技术难度,有人在做,解析才是难点
@codeforlife 很有道理的,这个好像无解,我可能只能找 hr 帮忙了
est
2015-09-02 11:38:06 +08:00
搞个 paper 解析引擎。把双栏 pdf 搞成自适应纯文本的。
xunyu
2015-09-02 11:39:52 +08:00
@est 恩, pdf 是下一步的工作,模型好了这个解析应该类似
ljbha007
2015-09-02 11:45:21 +08:00
我的简历是用 txt 写的怎么办
javaluo
2015-09-02 11:51:19 +08:00
公司内部的解析,简直牛爆
xunyu
2015-09-02 11:51:58 +08:00
@ljbha007 没关系, txt 比 word 格式更好处理
lvfujun
2015-09-02 12:10:15 +08:00
准确率有待提升哈.
llhh
2015-09-02 12:47:53 +08:00
Server Error (500 )
xunyu
2015-09-02 12:50:02 +08:00
@lvfujun 恩,之前是用猎头提供的模板开发的,现在想匹配更多样式

@llhh 多谢,我研究下是哪的问题
ToysMall
2015-09-02 12:58:07 +08:00
Server Error (500 )
ToysMall
2015-09-02 12:58:13 +08:00
Server Error (500 )...
qq723985066
2015-09-02 13:03:37 +08:00
我的简历使用 LaTeX 制作的,你这个能不能解析……
wangleineo
2015-09-02 13:10:40 +08:00
@xunyu nlp 用的是什么框架?还是自己的轮子?
xunyu
2015-09-02 13:13:54 +08:00
@ToysMall 稍等,我检查下

@qq723985066 这个还不能

@wangleineo 底层是用的 hanlp 加字典,上层是自己写的
xuxu412
2015-09-02 23:51:57 +08:00
taleo 不是已经做的很好了么,我在这边投简历都是上传 PDF 然后下一页基本信息就都出来了。非常的准……
Tedko
2015-09-05 11:06:25 +08:00
@xunyu latex 不能支持为啥 PDF 能支持。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/217768

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX