V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Aileencheng
V2EX  ›  酷工作

[实习] [北京] [字节跳动] 搜索算法、搜索架构、数据挖掘、数据抓取

  •  
  •   Aileencheng · 2019-09-18 16:30:02 +08:00 · 1641 次点击
    这是一个创建于 1679 天前的主题,其中的信息可能已经有所发展或是发生改变。
    [实习] [北京] [字节跳动] 搜索算法、搜索架构、数据挖掘、数据抓取

    字节跳动搜索部门介绍:
    字节跳动搜索部门主要负责今日头条、抖音、火山等产品的搜索业务,支持网页搜索和垂搜。通过大规模机器学习、深度学习算法,给用户最好的搜索体验,服务于字节跳动的全球用户。借助于字节跳动的流量和资源优势,你将与业界搜索大牛组成的一流技术团队共同成长,始终追求极致不断改进,一同探索搜索行业新的最佳实践。

    招聘方向:算法、工程
    地点:北京市海淀区北三环西路 43 号中航广场 1 号楼(矮楼)

    搜索算法实习生
    学历要求:本科及以上
    职位亮点:弹性工作,免费三餐,休闲下午茶,扁平管理,职业大牛,团队氛围好
    工作城市:北京
    工作年限:不限
    职位描述:
    1、参与 ByteDance 搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
    2、参与头条 /抖音 /TikTok 等核心产品的搜索研发工作,服务数亿全球用户;
    3、参与搜索核心算法改进,可能的方向包括:
    ( 1 ) NLP:将业界最先进的 NLP 技术应用到搜索算法改进中,包括纠错、分词、改写、Term Weighting、意图识别;
    ( 2 ) Ranking:解决千亿级网页的排序问题,攻克基础检索、相关性、意图理解、权威性、时效性等世界难题;
    ( 3 )页面分析和摘要:从千亿网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验;
    ( 4 )链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等;
    职位要求:
    1、出色的分析问题、解决问题能力;扎实的代码能力,扎实的数据结构和基础算法功底;
    2、有机器学习、NLP 和数据挖掘基础和开发经验者优先;
    3、熟悉 linux 开发环境,熟练使用 C++和 python 语言;
    4、如果你绝顶聪明,总是能 7 天深入一个全新的领域成为专家,则可以忽略以上所有要求;
    5、2020 年及以后毕业,实习时间不少于 3 个月,每周不少于 4 天;我们希望能有充足的时间培养你,也希望你能充分参与业务做出卓越的贡献;
    投递简历以“姓名+学校+获取信息渠道( XX 学校 BBS/脉脉 /boss 直聘)”命名发送邮件到 [email protected] ,邮件内容务必内包含实习天数+入职时间+实习长度(可以实习几个月)相关信息。

    搜索架构研发实习生
    学历要求:本科及以上
    职位亮点:弹性工作,免费三餐,租房补贴,休闲下午茶,扁平管理,过亿用户,职业大牛,团队氛围好
    工作城市:北京
    工作年限:不限
    职位描述:
    1、参与 ByteDance 搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
    2、参与头条 /抖音 /TikTok 等核心产品的搜索研发工作,服务数亿全球用户;
    3、参与搜索核心架构改进,可能的方向包括:
    ( 1 )设计开发千亿级网页搜索的数据流、分布式建库、在线检索系统,设计业内领先的检索架构;
    ( 2 )设计开发万亿级 Spider 系统的实时计算、调度分发、压力控制、蜘蛛抓取等服务;
    ( 3 )设计开发高可用的搜索引擎稳定性解决方案、自动测试和运维平台;
    4、在这里你可以毫无历史包袱地实现自己的架构梦想。
    职位要求:
    1、出色的分析问题、解决问题能力;
    2、出色的代码能力,出色的数据结构和基础算法功底;
    3、有分布式系统基础和开发经验者优先;
    4、精通 linux 开发环境、C++语言、网络和多线程编程;
    5、如果你绝顶聪明,总是能 7 天深入一个全新的领域成为专家,则可以忽略以上所有要求;
    6、2020 年及以后毕业,实习时间不少于 4 个月,每周不少于 4 天;我们希望能有充足的时间培养你,也希望你能充分参与业务做出卓越的贡献。
    投递简历以“姓名+学校+获取信息渠道( XX 学校 BBS/脉脉 /boss 直聘)”命名发送邮件到 [email protected] ,邮件内容务必内包含实习天数+入职时间+实习长度(可以实习几个月)相关信息。

    数据挖掘实习生
    学历要求:本科及以上
    职位亮点:免费三餐,租房补贴,休闲下午茶,扁平管理
    工作城市:北京
    工作年限:不限
    职位描述:
    1、负责搜索 Spider 系统的基础数据挖掘和核心技术研发
    2、负责互联网资源特征数据挖掘,包括页面特征、站点特征、页面价值度、热点变化趋势等
    3、负责链接的反垃圾,识别无价值链接,控制链接规模
    4、利用机器学习 /深度学习算法建立模型,预估链接质量
    职位要求:
    1、计算机或相关专业,本科及以上学历,2020 年及以后毕业
    2、优秀的编码与代码控制能力, 有扎实的数据结构和算法功底
    3、精通 C/C++语言编程,熟悉 linux 平台、shell 编程
    4、每周实习至少 3 天,可以连续实习 3 个月以上
    投递简历以“姓名+学校+获取信息渠道( XX 学校 BBS/脉脉 /boss 直聘)”命名发送邮件到 [email protected] ,邮件内容务必内包含实习天数+入职时间+实习长度(可以实习几个月)相关信息。

    数据抓取实习生
    学历要求:本科及以上
    职位亮点:免费三餐,租房补贴,休闲下午茶,扁平管理
    工作城市:北京
    工作年限:不限
    职位描述:
    1、负责搜索 Spider 系统的架构设计和核心模块开发
    2、负责搜索 Spider 分布式计算、调度、抓取、压力控制等模块的设计开发
    3、负责蜘蛛程序的开发优化,基于 webkit 内核的 js 渲染引擎
    4、负责网页特征抽取,利用模版或自动化抽取网页特征
    5、负责搜索 Spider 数据可视化,日常数据分析和监控
    职位要求:
    1、计算机或相关专业,本科及以上学历
    2、精通 C/C++语言编程,熟悉 linux 平台、shell 编程
    3、对数据结构和算法设计有较为深刻的理解
    4、有大数据工作经验,熟悉 hadoop/storm/spark 等经验者优先
    5、有搜索引擎 /Spider 抓取等相关经验者优先
    投递简历以“姓名+学校+获取信息渠道( XX 学校 BBS/脉脉 /boss 直聘)”命名发送邮件到 [email protected] ,邮件内容务必内包含实习天数+入职时间+实习长度(可以实习几个月)相关信息。
    3 条回复    2019-12-13 10:32:00 +08:00
    Aileencheng
        1
    Aileencheng  
    OP
       2019-09-18 16:30:17 +08:00
    蹲蹲简历
    Aileencheng
        2
    Aileencheng  
    OP
       2019-09-19 16:59:39 +08:00
    有没有看实习的小哥哥小姐姐呀!
    dick20cm
        3
    dick20cm  
       2019-12-13 10:32:00 +08:00
    @Aileencheng 请问是贵司哪个组的?有个朋友托我来问问
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1026 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 22:18 · PVG 06:18 · LAX 15:18 · JFK 18:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.