V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  p2pCoder  ›  全部回复第 5 页 / 共 57 页
回复总数  1123
1  2  3  4  5  6  7  8  9  10 ... 57  
年龄、性别、职业,这种基础特征,在任何推荐、广告、搜索 平台都有模型来做,简单来说,我知道海量用户中其中一些用户的真实年龄、性别、职业,那么我可以把这些当作样本,把用户的海量行为及其他基础数据当作特征,用来训练一个模型,有了这个模型,就可以用用户各种行为序列(可能包括搜索记录、点击记录、下载记录、付费记录,浏览记录),基础特征,得到用户的年龄、职业、性别,当然模型推测出来的,准确率肯定不会达到 100%。
至于同类视频推荐,从内容理解的观点来讲,可以用视频的图像、asr 、ocr 生成多模 embedding,本质上就是一个向量,既然有了向量,那么就可以用向量距离来表示相关性,这种一般由向量检索来做,想了解的话,可以搜索下 ANN 。
另外一类,是从推荐、广告、搜索的用户行为序列来看,可以用协同过滤以及衍生的各种算法,来达到一个相关性计算,比如如果两个视频出现在一个用户的观看记录里,我们就认为其相关,然后,可以根据这种在同一个用户的观看列表中出现的频次,来评判其相关性。
我是做工程的,对于算法的细节不能讲的很清楚,但是大体的数据 流程差不多是这样
教职很卷的,做这个选择的时候,在 v 站提问,肯定大多数人会让你选择教职,这没多少参考意义,还是要去问过来人,作为博士,圈内人肯定多,去问过来人,再做 trade off
看代码,看书,都是一个积累的过程,并不是一个完全的知识内化的过程,说到底,还是要用了,要在诸多限制下落地,才是最有意思,最有挑战的。还是要想办法去真实的世界解决真实的问题,特别是后端、算法这种岗位。
@James369 工程能力强的算法很多,这个群体是卷到变态的,我这几年就是做算法的工程落地的,作为一个后端,遇到过很多工程能力碾压后端开发的算法工程师。
@James369 所有技术的核心都在于商业价值,无论对于 cv nlp 还是推荐 搜索 广告,整个系统的计算和存储成本都是极高的,而算法模型的结构复杂度,参数数量,都是对计算 和存储的成本的极大考量。还有就是大公司的算法的核心 kpi 在于业务指标,不在于发论文,大厂的算法研究员现在也大都有落地的 kpi 了。
@James369 算法工程师核心在于落地,而且所有问题的基础在于数据,无论对于实验室的研究员还是大厂的算法工程师,做数据的时间都远多于做模型的时间,因为再复杂的模型都是一个确定的结构,都算是简单的,但是数据却有太多东西需要去探索。
片面点来讲,AI 最基础来说,就是统计,最基础的就是数据,有了数据就是去拟合一个 f(x)j=y 这个函数,就比如大学做实验的时候,我们会在坐标纸上根据点的分布,去拟合一个线性函数,这也是机器学习的一种基础应用。只是真实世界的数据特别特别多,很高维,对应的函数也特别复杂
这是很简单片面的理解,到了真正的落地就很复杂了
2021-06-18 11:57:38 +08:00
回复了 Mr0C 创建的主题 职场话题 去深圳还是去杭州
如果不是买不起房,想一直呆在深圳,气候太爽了
2021-06-09 15:51:23 +08:00
回复了 diggerdu 创建的主题 职场话题 请教各位,字节 NLP 和蚂蚁 LBS 的 offer 怎么选?
算法看业务,仅仅看岗位,看不出啥 diff
2021-06-08 10:11:07 +08:00
回复了 CourageHe 创建的主题 生活 读研 or 工作,最后一次选择的机会。
双非普通研究生,说到底,只能给你带来一个研究生的 title,收益有限,甚至会成为劣势
2021-06-07 10:49:40 +08:00
回复了 Co1a 创建的主题 随想 个人深圳实习三个月数据统计
不建议太分散精力,学习东西尽量集中点
@IITII scala 不冷门,但是主要大数据开发用的多
2021-05-20 13:48:17 +08:00
回复了 szzadkk 创建的主题 职场话题 成都腾讯 wxg 企业微信
@hhahha 微信上面留错了,d3hpZF9mODByNGl1M3lvdHEyMg==
2021-05-20 13:36:43 +08:00
回复了 szzadkk 创建的主题 职场话题 成都腾讯 wxg 企业微信
@hhahha 感兴趣可以加这个微信 aWx3eA==
2021-05-20 13:34:55 +08:00
回复了 szzadkk 创建的主题 职场话题 成都腾讯 wxg 企业微信
@hhahha 具体看你背景,成都上限不高,不过如果背景好点,找个满意的工作没啥问题
2021-05-20 13:32:33 +08:00
回复了 szzadkk 创建的主题 职场话题 成都腾讯 wxg 企业微信
有同学在里面,今年虽然靠着疫情年终还不错,但是对手太强大了,压力很大,产品喜欢瞎逼来,有很大话语权
2021-05-14 11:58:35 +08:00
回复了 t298 创建的主题 问与答 应届毕业生想去成都找工作,房子应该租到哪里合适呢?
建议刚毕业还是去一线闯一下
2021-05-14 11:57:17 +08:00
回复了 ChovyChu 创建的主题 Java Java 面试官应该怎么考察一个面试者的能力?
系统设计八股搜一下,总有和候选人背景类似的系统设计题
2021-05-14 10:24:27 +08:00
回复了 passant520 创建的主题 成都 跟风问问成都,不 996 的数据科学工作机会多吗?
这价格在成都没啥问题,拿到更高价格也没啥问题,银行 argue 一下,感觉大佬这履历在成都银行拿个 40wpkg 的工作,问题不大。我是做成都做算法业务的,大佬这要求在成都大厂拿 50w 肯定没啥问题,成都也有些外企,不过 wfh 很少,不过我对这外企这方面的岗位不了解。至于职业发展,我是对于数据科学、数据分析的职业发展路径不是很清晰,但是以做算法业务几年的经验来讲,核心技能还是由所从事的业务决定的。
1  2  3  4  5  6  7  8  9  10 ... 57  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2711 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 41ms · UTC 15:49 · PVG 23:49 · LAX 08:49 · JFK 11:49
Developed with CodeLauncher
♥ Do have faith in what you're doing.