NVIDIA 与悉尼科技大学提出:生成图像加入训练,助力行人重识别

2019-05-09 09:42:16 +08:00
 layumi

小弟的一个工作,欢迎点视频 Demo 来看。 代码肯定会开源,但是需要和公司商量一下,可能 2-3 个月。 [ CVPR19 Oral ] Joint Discriminative and Generative Learning for Person Re-identification, Zhedong Zheng, Xiaodong Yang, Zhiding Yu, Liang Zheng, Yi Yang, Jan Kautz

Paper: https://arxiv.org/abs/1904.07223

<iframe allowfullscreen="true" border="0" frameborder="no" framespacing="0" scrolling="no" src="//player.bilibili.com/player.html?aid=51439240&cid=90036752&page=1"> </iframe>

B 站视频备份: https://www.bilibili.com/video/av51439240/ 腾讯视频备份: https://v.qq.com/x/page/t0867x53ady.html

2252 次点击
所在节点    分享发现
12 条回复
rayhy
2019-05-09 09:58:29 +08:00
我也是做行人图片合成的,前两天看到您的论文震惊了好久...

我目前任务是给人换姿势,PG2 那系列的。不知道楼主觉得您做的东西可能往这个方向发展吗?比如继续从结构特征分离出姿势来?或者训练时模仿你的做法,也交换 ID 生成同 Pose 图片?

另外 CPVR Oral 级别的论文应该不怎么需要推广就一堆人 follow 的吧。
dinghow
2019-05-09 10:07:39 +08:00
惊,CVPR Oral 也需要推广了(lol ),前排支持一下
tycallen
2019-05-09 10:33:20 +08:00
关注
xiangchen2011
2019-05-09 11:22:55 +08:00
厉害了,膜拜下
SeaRecluse
2019-05-09 11:33:26 +08:00
当初学习入门 NLP 的时候知道的大佬,现在专心 CV 了吗
Showfom
2019-05-09 12:49:07 +08:00
额 除了一个老外都是中国人啊 牛逼
sunxia
2019-05-10 11:00:30 +08:00
支持支持支持
layumi
2019-05-10 13:36:34 +08:00
@SeaRecluse 之前想尝试 nlp。。。其实我也就一篇 nlp 相关的文章,,
layumi
2019-05-10 13:36:58 +08:00
@Showfom 那个是 nvidia research 的大老板。。德国人。。
layumi
2019-05-10 13:40:59 +08:00
@rayhy 我觉得 human parsing 可能比纯 structure 更靠谱。其实我这里的边缘处理还是有颜色不连续。 另外你仔细看原始的 jpg 训练数据,也有边缘的问题。如果从 jpg 转到 png 会好一点(扯得有点远了)。所以用 dense 的 parsing 可能会好。 题外话,我今年签证被卡了,也不知道能不能去成。。当时 cyclegan 也是 Efros 老板站台宣传的,感觉宣传还是有必要的。
dalieba
2019-05-10 18:43:03 +08:00
那就看将来的大客户是谁了
layumi
2019-07-01 13:34:58 +08:00
代码开源了。Github 地址是 https://github.com/NVlabs/DG-Net

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/562396

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX