V2EX 首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  职场话题

我这个简历能拿到什么级别的 Offer?

  •  
  •   menc · 44 天前 · 5480 次点击
    这是一个创建于 44 天前的主题,其中的信息可能已经有所发展或是发生改变。

    校招季到了,相求一个 NLP/推荐系统 /ML/DL 方面的工作

    求大佬收留!

    简历在这里: https://github.com/PengFoo/cv/blob/master/cv.pdf

    精简版:

    付鹏 北京市海淀区学院路 37 号北京航空航天大学,100191 [个人信息见简历 PDF ]

    技能

    • 热爱 coding、自然语言处理和机器学习 /深度学习,喜欢和人交流

    • 熟练使用 Python,了解 C++,能够独立解决遇到的问题

    • 熟悉机器学习和深度学习相关算法和技术

    • 熟练使用 TensorFlow、XGBoost、Scikit learn、gensim 等工具

    • 详细阅读研究过 jieba 分词的源码和 word2vec ( mikolov )的源码

    • 熟悉 Hadoop 和 MapReduce 程序的编写(包括 Hadoop Streaming )

    • 熟知网络攻击的方法,熟练使用安全检测相关工具

    • CET6 通过,优秀的听说读写能力

    教育经历

    北京航空航天大学	软件学院	2011.9-2015.6	北京
    
    北京航空航天大学	计算机学院	2015.9 至今	北京
    

    实习 /研究经历

    腾讯新闻	基础技术研究	2017.06-2017.08	北京
    

    • 负责自动文本摘要的前沿探索和代码实现,用于新闻简报的生成

    • 编写了两版本的自动文本摘要算法,传统机器学习方法 NewsBrief ( extractive )和基于 Attention based Seq2Seq 的 TextSumm ( abstractive )

    • ROUGH-1、ROUGH-2 比传统方法 Textrank 和 Textteaser 高 10%

    今日头条	基础技术研究	2016.05-2017.04	北京
    

    • 负责今日头条 APP 视频频道的相关视频推荐,参与大模型的设计和核心代码的编写

    • 将 word2vec 引入推荐系统,根据推荐系统 item 的特点提出 tag2vec 方法

    • 全量上线后 Staytime/U 提升 1.2%,Read/U 提升 2%

    Kaggle Quora 冲突问题识别比赛	数据挖掘比赛	2017.04-2017.06	北京
    

    • 在 Kaggle Quora duplicate digest 比赛中取得银牌

    • 编写了一个比较自动化的框架用于特征抽取和模型训练

    天池“阿里云安全算法挑战赛”	数据挖掘比赛	2016.08-2016.10	北京
    

    • 钓鱼网站检测和 Webshell 通信检测,使用了多种 ML 模型和 NLP 方法

    • 取得 top2%的成绩(第一赛季:12/970,第二赛季:23/970 )

    搜狗	基础技术研究	2015.11-2016.5	北京
    

    • 使用 LR/GBDT 等模型对新闻和文章内容进行 CTR 预测

    • 使用 GBDT+SVM stacking 进行低质文章的识别和筛选

    北航-浦发合作项目	基础技术研究	2014.11-2015.05	
    

    • 研究大规模数据下的自然语言问答系统( Q/A System )的设计和实现

    • 从非结构化文本中构建知识库,问题意图识别、段落粗筛、句子筛选、答案抽取和 ranking

    英特尔应用创新大赛全国总决赛	NLP + APP 开发	2013.10-2014.04	北京
    

    • 组建团队开发自然语言处理的智能助手 Android APP (任务驱动型 NLU )

    • 获得多个国内科技大赛奖项

    Wooyun 网站	认证白帽子黑客	2011.09 至今	北京
    

    • 提交 Srun3000 身份认证漏洞,正方教育信息泄露漏洞被 CNVD 认可

    • 提交搜狗网站源码泄露漏洞被搜狐认可

    59 回复  |  直到 2017-08-14 17:08:22 +08:00
        1
    lxml   44 天前   ♥ 1
    大部分知识超出知识范围了,不过要是这条属实的话

    >详细阅读研究过 jieba 分词的源码和 word2vec ( mikolov )的源码

    30K 不为过,哪怕应届也行,能看懂这俩项目源码的绝不是泛泛之辈。

    根据经验,这种看起来很厉害的项目经历,要么纯属吹逼,要么纯属装逼,中间没有值域。
        2
    menc   44 天前
    @lxml
    我的博客有结巴分词比较详细的源码解析,不过在另一个域名里。
    http://zhazha.me/
    不过已弃用
        3
    menc   44 天前
    @lxml
    多说一句,这俩项目在 NLP 里面也属于入门项目,看懂这两个在领域内应该还算不上什么。。。
    一个是应用了 HMM 模型的 language model
    一个是 400 行的 C 代码,其实都不难
        4
    carlclone   44 天前 via Android
    来吧,继续打击我
        5
    Authuir   44 天前 via Android
    仰望北航大佬
        6
    lxml   44 天前
    @menc #3 我也看过 jieba,而且是在熟练运用后再去看的,恶补了一大通相关领域的知识才勉强看懂,你这不才是硕士刚毕业么,哎,段位有差距啊。
        7
    prasanta   44 天前 via Android
    很棒,加油
        8
    kuhung   44 天前 via Android
    😂很稳,至少不是白菜价。膜巨巨
        9
    zhengxiaowai   44 天前
    牛逼

    实习了那么多好企业,根本不用走校招了。这么牛逼,打个招呼就回去上班了,在中国找不出几个比你实习更好的企业了。
        10
    xern   44 天前 via Android
    很棒了
        11
    alexapollo   44 天前
    - ROUGH-1、ROUGH-2 比传统方法 Textrank 和 Textteaser 高 10%
    1. 这里取的基线是不是过于基础了,至少也要和行业内领先的方法来比?
    2. 指标是 ROUGE,不是 ROUGH,这个错误十分低级
    3. 结果是否有上线运行,如有,是抽取式还是生成式?

    感觉拿 offer 还是很容易的,但缺点也很明显,就是做的事情太杂了,指标也不突出,看起来没有专长,很难开高。
    除非你能说出有什么亮点,比如 tag2vec 有做什么样的改造(然而我估计是非常简单的思路)
        12
    Nicoco   44 天前
    老哥,感觉你是在秀简历了……
        13
    menc   44 天前
    @alexapollo

    抱歉出现了错误。
    其实我都不想写这个了,但是他们说简历一定要写数字来吹牛。。因为 abstractive 和 extractive 来比 ROUGE 没有什么用,ROUGE 这个指标在现在 abstract 盛行的时候不足以作为一个好的衡量指标。abstract 方法本身有很多语句不通的情况,ROUGE 都没有体现出来。

    第二个问题指标不突出,其实在很成熟的产品上有 1%的提升,是很厉害的事情,单算法有 1%的提升其实不容易。

    第三个问题,说到 tag2vec 的改进,至少比 item2vec 这种简单套用好的不是一点半点的。

    要说杂的话其实也不算杂,从 ML 到 DL,都是 NLP 相关的
        14
    akakcolin   44 天前
    很优秀,棒
        15
    nbabook   44 天前
    @menc #13 应届今年毕业吗?可以来我这,国企,解决北京户口。。。感兴趣吗,谈下?
        16
    jadecoder   44 天前
    在头条实习一年没拿到校招 offer ?
        17
    menc   44 天前 via iPhone
    @jadecoder offer 这东西是拿来比较的吧。。
        18
    menc   44 天前 via iPhone
    @nbabook 如果是做技术的话可以考虑啊
        19
    jadecoder   44 天前
    @menc 不是说头条的算法岗是整个行业钱最多的校招 offer 吗?除了阿里星这样的
        20
    nbabook   44 天前
    @menc #18 肯定是做技术啊,网络安全或者 NLP 方向,觉得可以我让人力跟你联系,咱们来聊聊
        21
    menc   44 天前
    @jadecoder
    钱不是找工作的唯一考量吧,尤其是北京这里
        22
    Kalv8n   44 天前 via Android
    我怀疑你是故意秀的
        23
    jadecoder   44 天前
    @menc 你要是说想去 Google Facebook 我也可以理解,但是如果已经拿着头条的 offer 了,还来 v2 问这个问题,未免有些奇怪
        24
    menc   44 天前
    @jadecoder
    其实 V2 大佬非常多,这两天在酷工作意外发现了很多很好的校招内推,包括蚂蚁金服这样学院内部没有的内推消息。
        25
    alexapollo   44 天前
    @menc
    泛 NLP 还是很难开高的,除非去做互联网+医疗这类垂直行业,不然现在泛 NLP 最大场景就只有 feeds 流了。
    头条已经开始抢微博 /知乎的地盘,感觉已经是红海市场厮杀了,去了也没太多好处。
        26
    menc   44 天前
    @alexapollo

    厉害了。。第一次听到泛 NLP 的概念。。实习了几家之后发现算法岗位其实也是哪里缺人就顶哪里的,在腾讯我之前做 text abstraction,现在做 NLG,看起来接近其实也蛮大差距,正式员工也是这样的,不是纯 research 公司,不存在专门研究一个小问题的说法吧
        27
    virusdefender   44 天前
    https://chaitin.cn/cn/join-us.html

    尝试使用词法语法分析和机器学习的安全公司考虑么,哈哈哈,看到你也接触过安全
        28
    alexapollo   44 天前
    @menc 感觉你最好的机会是去 google feed,非常 fresh,而且成功概率非常高,现在能进去升的估计非常快
        29
    menc   44 天前
    @alexapollo 怎么才能进去呢。。简历都不知道那里投。。
        30
    anyele   44 天前 via Android
    简历牛逼
        31
    417704684   44 天前 via iPhone
    明人不装暗逼
        32
    fanyuxi   44 天前 via Android
    乌云写在简历上真的有用?
        33
    menc   44 天前
    @fanyuxi 笑尿,这个真的是情怀了,实在舍不得这个经历
        34
    pqee   44 天前 via Android
    我司目测招不起,年薪 30 的干活
        35
    KevZhi   44 天前
    2011.9-至今
    意味深长
        36
    miclushine   44 天前
    仰望大佬,感觉只有 byvoid 大神可以一战
        37
    copperusher   44 天前
    的确很厉害,夸奖的话我就不说了,说点别的。

    1024 上夸耀自己有 18 公分、战果无数、但不给一点细节的少不了挨骂。最基本的是给几个比较详细的案例,愿意多说的还会附上心得体会、成长经历什么的。如果楼主不是纯炫耀,那就再发点干货上来,让大家也开开眼界,而不只是羡慕嫉妒恨。没有干货,那就只是广告,你再怎么努力、看起来再怎么好,也只是自己的事情。
        38
    okface   44 天前 via Android
    北航大佬果然牛逼
        39
    menc   44 天前
    @copperusher
    这个帖子发在酷工作节点就是求职的。。如果要干货的话,那是不是到了日常晒博客时间(滑稽)
    我的博客有干货的,也很用心在维护
    http://www.pengfoo.com/
    希望能帮到一些学习者
        40
    cqcn1991   44 天前
    @alexapollo 围观大佬们交锋...
        41
    mayokaze   44 天前 via iPhone
    menc 聚聚你们 seq2seq 做 abstraction 效果好吗?
        42
    huangzitao   44 天前
    大家不要慌,无非是一大堆名词没听过而已,淡定。。。
        43
    exploreexe   44 天前
    同学 在 V 站上的帖子是没自己发删除的。你这么把简历贴上来,就不怕被社工吗?你说自己搞过安全,我不大信呀。

    看了你 github 的简历,看起来挺牛逼的。
        44
    pqee   44 天前 via Android
    乌云没法至今了,乌云已经亡了。
        45
    Antidictator   44 天前 via Android
    @exploreexe ... 为什么你会这么想... 阮一峰等大佬会觉得名字不能被人知道?
        46
    Antidictator   44 天前 via Android
    @pqee 要信乌云知道吗,才一年多一点😂😂😂
        47
    sofs   44 天前 via Android
    35k
        48
    yangff   44 天前
    @exploreexe 你不会套马甲吗……
    指望社交账号无法被社工才是奇怪的想法吧
        49
    snnn   44 天前 via Android
    @lxml word2vec 的代码很少。放出来的只是一个 demo,用于发 paper 的
        50
    Phariel   44 天前 via Android
    如果真这么牛逼 建议去硅谷历练几年
        51
    UnknownR   44 天前
    乌云。。。机器学习加网络安全?膜拜大佬
        52
    snnn   43 天前 via Android
    lz,加油吧。北京这么大,肯定有能容纳你的地方。趁现在校招还没开始,好好准备准备。功夫不负有心人
        53
    mpich   43 天前
    paper ?
        54
    starvedcat   43 天前   ♥ 1
    the definition of humblebrag.
        55
    bravecarrot   43 天前 via iPhone
    搞安全+NLP 我都知道你是哪个实验室的 X )
        56
    hustlike   43 天前
    厉害厉害
        57
    fanhaipeng0403   42 天前
    厉害厉害
        58
    lycos   42 天前
    lz 是牛人
        59
    Madkill   42 天前
    看起来很厉害,是个炫耀贴嘛?那我就安利一波 strikingly
    DigitalOcean
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   鸣谢   ·   1069 人在线   最高记录 3541   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.7.5 · 75ms · UTC 16:55 · PVG 00:55 · LAX 09:55 · JFK 12:55
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1