AI 部门的后台开发

2020-02-28 10:04:37 +08:00
 huangzongzhuan

最近收到某家公司的 offer,岗位是 AI 部门里的后台开发,据了解主要是做接口,有大佬做过类似的岗位吗

6754 次点击
所在节点    程序员
52 条回复
secsilm
2020-02-28 12:40:55 +08:00
@sessionreckon 理是这个理,就是话有点糙啊。算法平常是都搞模型相关的,对后台接口这块一般不会很熟悉,和专门做后端的根本比不了。所以一般都是算法开发模型,后端负责改成接口上线,当然改造的过程中算法也会介入一点。
huigeer
2020-02-28 12:48:40 +08:00
sz ? 某视?
huigeer
2020-02-28 12:51:01 +08:00
日常 CRUD,k8s docker 本地化部署 /doge
sadfQED2
2020-02-28 13:00:27 +08:00
@huangzongzhuan 我们部门也有算法岗,我可以给你解释下是干嘛的。首先,他们算法那边会出个算法,他们一般是 c 或者 python 实现,就比如文字识别,他接口要求 500*200 尺寸的 png 图片,接口 rpc 调用。这个时候你的工作就是在他的基础上,封装成一个 http 接口,可以支持任意 jpeg.png.pdf 等等格式,各种尺寸(你需要裁剪,压缩等预处理),同时加上权限验证,防盗用等等功能,最后写个文档。
sadfQED2
2020-02-28 13:02:24 +08:00
@sadfQED2 你有兴趣肯定可以和写算法的人交流下怎么实现的(但是你多半听不懂),具体技术来说就是 cudr,唯一复制点的可能就是需要做防盗用,权限检验,自动熔断
huangzongzhuan
2020-02-28 13:10:14 +08:00
@sadfQED2 非常感谢,很详细
sessionreckon
2020-02-28 13:42:27 +08:00
@secsilm 那是你以为的,和你见到的.
事实上有很多公司就是算法岗做工程接业务做接口,没有独立的工程团队
代码实现糟糕的一塌糊涂,性能也很差,拿机器扛上去
比如头条的某些部门...
ZSeptember
2020-02-28 13:52:29 +08:00
业务开发,代码都是没技术含量的。
重点就是业务建模,业务理解
secsilm
2020-02-28 13:57:10 +08:00
@sessionreckon

> 事实上有很多公司就是算法岗做工程接业务做接口,没有独立的工程团队

这个没毛病,确实是现状,包括我们也是,我自己就是主算法,兼职后端。

> 代码实现糟糕的一塌糊涂,性能也很差,拿机器扛上去

这个代码水平真的看个人造化了,确实有很多算法不会写接口,也没有接触过这些,尤其是新人。前几年招算法的时候偏重点都在算法研发上,我看现状的算法招聘好多都会要求有一定的后端能力。但是这个「一定的后端能力」,我还是那个意见,和专职后端是没法比的。不过算法其实也应该努力实现工程上的优化,速度并发什么的,但是很多时候由于时间等各种问题,通常不会太好。这个时候就需要专职后端介入了。

个人见解。
p2pCoder
2020-02-28 14:43:31 +08:00
@huangzongzhuan 机器学习平台和推荐引擎还是很有挑战的
记住一定要对分布式计算和推荐系统有一定了解,不要和算法割裂开来
召回 特征工程 样本工程 离线训练 在线预估 策略这些,做推荐引擎、机器学习平台 不要和算法割裂,分布式计算和高性能计算是这些的核心竞争力
有机会一定要做核心业务,别做边缘业务,你的业务挑战决定了这份工作的好坏,上面给你提意见的老哥们的意见未必对,因为和你要新进入的公司的业务规模,业务挑战未必对等
建议你了解推荐引擎对应业务的 pv uv 状况,收入在什么量级,在线模型规模能达到多大,样本量在什么量级,预估 qps 在什么量级,这些能对在整个业内出于什么状况有个好的判断
UsherOu
2020-02-28 14:50:20 +08:00
其实就是帮他写 web 接口,算法想都不要想
sessionreckon
2020-02-28 15:21:39 +08:00
@secsilm 只看个人造化就太随缘了
这就涉及到每个人的价值和定位问题,大部分人并没有强到能各个方面都做好(当然能力足够强的,肯定有,但是也涉及升职不做一线的问题)
毕竟在我们这,说性能提升了 10%/效果上升 1%,显然是效果变好更得到老板认可
逐渐演变成代码只要能跑就好,性能不够机器堆
所以才需要有独立的工程团队来支持工程,有合理的职责划分
代码要写好还需要多看,看开源代码怎么写,看工程实现源代码,理解对应的思路和 best practice
这些都非常花时间,算法同学更愿意把时间花在多读两篇论文上.
glfpes
2020-02-28 17:31:55 +08:00
这不是我在干的事嘛 只有算法是远远不能落地的
1,或许是引擎团队,不过这个还是很难做的,考虑性能一般 C++是比较合适的
2,或许是数据团队,比如实体,特征,画像,报表建设
3,或许是基础服务团队,比如提供 tensorflow 服务,faiss 服务等
glfpes
2020-02-28 17:43:42 +08:00
做引擎基本上面对的是高 QPS 的复杂系统问题。
做数据基本面对的是大数据,spark flink kylin druid 这些工作。
做基础服务在大一点的公司一般有独立团队,如果小公司的话类似于内部阿里云这种了。
nnqijiu
2020-02-28 18:10:14 +08:00
主要就是写写接口咯,还有算法部署运维这些
exception365
2020-02-28 18:11:29 +08:00
所以到底是 CRUD ?还是 CURD ?还是 CUDR ?
我看这个帖子之前一直以为大家都是叫 CRUD 的...
useben
2020-02-28 19:08:25 +08:00
我这有几个项目就是。。。,比如我是 go,ai 那边封装 so 给我,或者请求对方接口,其实就是你传数据过去,人家给你结果,你 curd or 做一些用户习惯行为之类的数据上报收集。或者呢,人家代码能力差,也可能让你来实现下算法逻辑滴。。。
freezhan
2020-02-28 19:37:12 +08:00
某式?
fancyhan
2020-02-28 21:17:08 +08:00
做接口=普通后端=crud+加班 996
xiaojie668329
2020-02-28 21:52:23 +08:00
就是 crud,代码也比较简单,重点是熟悉业务,需要会 K8S 之类的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/648243

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX