神马搜索的离线研发有大神知道么?

2014-08-15 12:06:13 +08:00
 syaokun219
今天被约了电面,不知道要准备什么东西呢,我贴出来一下他的原始要求吧。
我们需要你:
1、参与转码以及数据监控的相关工作,将转码成果应用于移动搜索离线、排序等环节
2、协助构建超大规模网页处理系统,优化和度量全网移动搜索数据质量
3、参与离线系统工作,提升搜索体验

我们希望你:
1.熟悉linux平台,了解一门脚本语言(shell/python/perl等)
2. 有一定的计算机基础,具有良好的编程习惯和算法基础
3. 较强的分析问题和解决问题的能力
4. 热衷技术,有责任心和团队合作精神
3502 次点击
所在节点    程序员
8 条回复
hitsmaxft
2014-08-15 12:16:32 +08:00
看起来是网页抓取和离线算法模块
aszxqw
2014-08-15 12:17:46 +08:00
offline 的话。
说好听就是数据挖掘,说难听点就是数据统计。
jason52
2014-08-15 12:19:45 +08:00
ucweb最近某一个版本升级,默认搜索引擎替换掉了百度,改为sm了,其实我倒是无所谓,下载app也倒流到一个pp下载站上去了。

应该是是阿里收购了uc,然后出搜索的一帮人新开了一个神马。
syaokun219
2014-08-15 12:22:12 +08:00
@hitsmaxft 不懂,感觉得准备一下linux和python相关的东西吧
syaokun219
2014-08-15 12:22:57 +08:00
@aszxqw 是不是要求低一点,我去看看linux的东西吧
syaokun219
2014-08-15 12:23:13 +08:00
@jason52 恩呢,公司的来历我倒是清楚
aszxqw
2014-08-15 12:37:50 +08:00
@syaokun219 是的
bigwang
2014-08-15 13:19:02 +08:00
主要是在hadoop上倒腾字符串
看看相关的资料就行

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/128051

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX