一个严肃的关于深度学习鉴黄的问题

2018-01-09 12:14:26 +08:00
 xwhxbg

怎么鉴别平胸妹子?我试图把平胸妹子标记为黄图,但是会误伤没穿上衣的汉子啊,怎么办呢?

17560 次点击
所在节点    TensorFlow
98 条回复
Trim21
2018-01-09 23:07:28 +08:00
既然男女的标准不一样,就先判断性别...
akira
2018-01-09 23:38:59 +08:00
一堆男的有 B 兆杯
alvinbone88
2018-01-09 23:52:17 +08:00
如果要识别性别的话,可以考虑计算手、脚的大小,腰围,臀围以及大腿,有可能还要加上面部识别

一般来说,男的手脚相对来说大一些,腰也会比女的要粗;男的大腿和臀部没有女的那么丰满

最后问一句,楼主的算法能识别 gay 片不?
des
2018-01-10 00:12:46 +08:00
@alvinbone88 怎么,你想借一部说话么?
Faiz555
2018-01-10 00:17:49 +08:00
如果是胖子怎么办,不是平胸呢
alvinbone88
2018-01-10 00:25:11 +08:00
@des #64 不不不,纯粹是好奇
orvice
2018-01-10 00:30:46 +08:00
有时候路上都会和朋友讨论下刚刚走过去的是男还是女- -
机器更不知道了 233
shiyouming91
2018-01-10 04:52:25 +08:00
求训练数据顺便求 block😂
shakespark
2018-01-10 08:48:15 +08:00
@alvinbone88 出门右转 500 米就到 pornhub
shakespark
2018-01-10 08:48:46 +08:00
@shiyouming91 为啥要自求 block
VicYu
2018-01-10 09:08:54 +08:00
乳头间距和肩宽,有一个比例,男女的值不一样

帮你找找当时的数据,14 年做的,有点困难
northisland
2018-01-10 09:22:56 +08:00
既然都做了这么事儿逼的项目了,标准当然设的严一点啊

做了这种项目,就比较类似临时工,关键时刻给内容审查、精神文明顶雷的。要有觉悟
northisland
2018-01-10 09:29:49 +08:00
@VicYu

作这事是一大串模式识别的 pipeline 么?
wildlynx
2018-01-10 09:42:23 +08:00
不是“宁可错杀千个,不可放过一个”吗?
mcone
2018-01-10 09:44:47 +08:00
楼主你到底之前做过这个方向吗?看了一遍你的回复,我觉得你不太像是遇到问题求助,而是试图通过大家来入门这项工作;如果我判断错的话,我觉得你可能需要重新理一下你的思路

我室友两年前做过这个,还发了一篇 ccfc 的垃圾会议,一个求数据的都被你屏蔽掉,我也是非常不理解,这一块真的没有像样的公开数据集,你的数据怎么来的,除非是自己抓的,不然难道没有自带 label ?至少作为甲方,乙方难道没有一个大致的需求进一步来细化某些问题(是否区分男女,图片是否露脸等)?

另外,看你多次提到 open-nsfw,我由于室友的关系也接触过这个,只想说啊……尽信书不如无书。如果这句话做不到的话,那就尽信书别求创新就行了,至少自己不会把自己推入一个看似努力但是没什么卵用的大坑
xwhxbg
2018-01-10 10:04:52 +08:00
@alvinbone88 不能。。。ish,我的样本没有那么丰富 T T
@shiyouming91 左转 metart,我数据在那爬的
@northisland 是啊,我都想设置 0.3NSFW 就屏蔽了。。。
@mcone 我没做过这个方向,而且以前是前端来着。。。赶鸭子上架了,开口求数据的几位同学我观察了一下,可能单纯就是求黄图的,我的数据是 metart 上抓的,然后手动分类,训练集 1500 黄图,1500 不黄的,没得甲方,产品爸爸提的需求,不关心我怎么实现。open-nsfw 主要提供参考,我是用的 TensorFlow,它用的 Caffe,不过它的 loss 函数和激发函数都很有价值。这方面的书我基本没看过,有啥推荐的么,目前在看 andrew ng 的课,比较基础。
xwhxbg
2018-01-10 10:12:56 +08:00
感觉大家对深度学习有点误会,类似于体征比如 cup 这样的数据从图上面是得不到的,除非你有人家体检的数据

总结了一下各个楼层的回答,目前看来比较可行的是通过无监督学习先去分类,然后看看哪些类是黄图。

其余的方法,比如测量 nipple 的大小是基本不可行的,图的像素分布并不能决定这个,除非能有体检的数据

另外我是真的很水啊,我以前是前端来着,深度学习是因为产品爸爸有需求,然后公司又不大,所以我就来做了

到今天我还在看人家的视频 tutorial 呢。。。
mcone
2018-01-10 10:14:01 +08:00
@xwhxbg 难怪,看你回复感觉就不是做这个的……

没有甲方就去问产品爸爸吧,让他把需求进一步细化,你的疑问都丢给他过一遍再说。另外,你这正负样本加起来才 3k …………你让产品爸爸想办法在数据集后面加两个 0 吧,最起码加一个 0 然后用 svm 之类的简单分类器;不然要么放弃训练只拿别人模型做测试,结果随缘,要么让这个 PM 滚……

另外,如果赶鸭子上架的话,如果不是时间特别宽裕个人建议别看 dl 的课程了,学完了你也会发现在应用中没啥大用(实际工业中几乎都是掉包侠,谁管你反向传播公式怎么推)。真想看的话,找一本统计机器学习的书从基础慢慢啃,DL 理论上主要就是数学基础+网络拓扑两部分
Raidal
2018-01-10 10:15:54 +08:00
训练识别脸也越来越难,现在很多小男生脸部特征越来越像女生,:)逃
auhah
2018-01-10 10:16:36 +08:00
学会拒绝产品的不合理需求

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/421323

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX