V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
anthonyeef
V2EX  ›  程序员

百度在 AI 比赛中作弊。

  •  
  •   anthonyeef ·
    Anthonyeef · 2015-06-04 14:36:19 +08:00 · 7726 次点击
    这是一个创建于 3251 天前的主题,其中的信息可能已经有所发展或是发生改变。

    http://www.nytimes.com/2015/06/04/technology/computer-scientists-are-astir-after-baidu-team-is-barred-from-ai-competition.html?_r=2

    SAN FRANCISCO — A group of researchers at the Chinese web services company Baidu have been barred from participating in an international competition for artificial intelligence technology after organizers discovered that the Baidu scientists broke the contest’s rules.

    32 条回复    2015-06-07 16:03:35 +08:00
    anthonyeef
        1
    anthonyeef  
    OP
       2015-06-04 14:38:25 +08:00
    @Livid 我不知道应该放在哪一个节点,所以放在了程序员这里。
    kisshere
        2
    kisshere  
       2015-06-04 15:48:22 +08:00 via Android
    这话说得,好像百度以前还没做过弊似的,呵呵
    ljsrzc
        3
    ljsrzc  
       2015-06-04 15:52:18 +08:00
    @anthonyeef 好可爱的楼主
    zhangqinmiao
        4
    zhangqinmiao  
       2015-06-04 16:00:39 +08:00
    哦→_→
    xfspace
        5
    xfspace  
       2015-06-04 16:02:16 +08:00
    知道了,楼下发表下意见
    TuxcraFt
        6
    TuxcraFt  
       2015-06-04 16:08:16 +08:00
    360 腾讯 百度 ……这类流氓软件,他们在国内的流氓行为为所欲为,无人能管。
    结果到了国际上…… 只能吃翔了。所以就需要来点小聪明…… 结果导致了现在吃翔还难受的代价
    yuedingwangji
        7
    yuedingwangji  
       2015-06-04 16:08:41 +08:00
    让我想起了不久前360提交的2份杀毒报告被世界知名公司退回来
    1023400273
        9
    1023400273  
       2015-06-04 16:11:08 +08:00
    楼主,涉世未深啊,你以为百度没做过弊么?纵观互联网行业的各种抽奖系统有多少个不作弊?哪个在线博弈游戏能做到真正的机器random?跟别是真实的自然概率了!楼主还是太年轻了-_-##
    CodeingBoy
        10
    CodeingBoy  
       2015-06-04 17:09:57 +08:00 via Android
    @1023400273 所以微博抽奖也是假的?
    1023400273
        11
    1023400273  
       2015-06-04 17:56:44 +08:00
    @CodeingBoy 微博目前信誉度还是不错的,我没有说全部,只是说大部分都是这样
    linxy
        12
    linxy  
       2015-06-04 18:08:40 +08:00
    这要感觉LZ是一副严肃脸…
    lollipopcap
        13
    lollipopcap  
       2015-06-04 18:57:21 +08:00
    不作弊就不符合我们大百度的作恶风范了,想当初百度杀毒不作恶,后来也加入了百度大礼包,帮你装杀毒装卫士装浏览器……专业毁产品
    yylzcom
        14
    yylzcom  
       2015-06-04 19:50:00 +08:00 via Android
    今天又一次被百度蠢哭,第一次是在 /t/196135
    opennet
        15
    opennet  
       2015-06-04 19:52:54 +08:00
    坑国人算了,干嘛还要坑外国人,作死!
    MForever78
        16
    MForever78  
       2015-06-04 20:09:14 +08:00
    @opennet 这叫什么话,你把自己放在什么位置?
    hoichallenger
        17
    hoichallenger  
       2015-06-04 22:33:44 +08:00
    日雅也有报道了
    ?1
    qige023
        18
    qige023  
       2015-06-04 23:09:39 +08:00
    说明了 程序汪为了 李彦宏 传说中的50薪 年终奖不为余力 ~
    nkssai
        19
    nkssai  
       2015-06-04 23:36:38 +08:00
    其实这个比赛自己也有bug,不更换验证数据,才会让参赛者撞库撞出过拟合的结果。一般这种比赛都会限制刷新提交结果的时间,而且还有在一段时间后更新库的。=。= ,当然百度这样干真是丢脸。
    jacob
        20
    jacob  
       2015-06-05 01:32:09 +08:00
    @nkssai 这个是比赛,比赛都有题库,你频繁更换如何保证公平?这个原本每周只允许提交2组测试结果,百度注册了30个帐号,以百度的能力spam服务器还是小菜一碟的,
    gkiwi
        21
    gkiwi  
       2015-06-05 01:56:02 +08:00   ❤️ 2
    事件原委大概就是做图片分类识别,人眼的误差率是5%,谷歌做到了4.8%,百度使用了一点手段做到了4.5%。
    ImageNet网站存在的目的是为了提供一个更好的竞争平台以让世界的图片识别水平提高,因为其名气大权威高,所以百度家做着做着就纯为这个排名了。
    而是用的策略就是不停的用小号去测ImageNet的测试数据特征,然后优化自己的程序,实际上就是把原本用来测试你机器学习算法效率的的测试库当成了训练库来用了,最后通过过拟合,实现了4.5%。。。

    估计当事人是得哭了,毕竟圈子那么小,一作弊基本上大家就都知道了。。[蜡烛~]
    Pandroid
        22
    Pandroid  
       2015-06-05 06:43:03 +08:00 via Android
    把测试图集当作算法训练图集,也真是够可以的
    aladd
        23
    aladd  
       2015-06-05 10:39:44 +08:00
    公司的规模和其道德水准不划等号。。。
    otakustay
        24
    otakustay  
       2015-06-05 13:35:17 +08:00
    某个人对这事的一句话说得好:GRE、托福做机经的人都是作弊
    quix
        25
    quix  
       2015-06-05 13:54:34 +08:00
    国内的大企业不怎么重视形象... 这到底是社会集体的价值观扭曲呢, 还仅仅是国人面前的形象不值钱导致的.
    g00001
        26
    g00001  
       2015-06-05 17:37:32 +08:00
    舆论对比较大的互联网公司作弊骂的还是比较欢乐的、一般就不会有那种怒不可遏愤怒声讨的样子,笑贫不笑娼嘛。但如果是针对个人站长......什么的,那么就可能就出现一大堆高调的圣人婊奋力狂喷且难以自禁了,看起来是正义的样子其实骨子里就是奴性。
    Khlieb
        27
    Khlieb  
       2015-06-05 22:50:09 +08:00 via Android
    @TuxcraFt 他们其实是被政策惯坏的
    nkssai
        28
    nkssai  
       2015-06-06 17:35:32 +08:00
    @jacob 本来就是考验模型的E_{out},比赛中切换验证集是很正常的事情啊。不知道你聊不了解机器学习的比赛。用切换验证集的方式防止提供的算法过拟合也算是正常的方法吧。 而且,切换验证集不能保证比赛的公平性这个说法,我还是第一次听说。
    nkssai
        29
    nkssai  
       2015-06-06 17:43:54 +08:00
    @gkiwi 当事人确实是面子上挂不住,说不定这东西也是KPI逼出来的。Baidu每年在NIPS、ICML这些顶会上花钱当Sponsors,不知道他们的人参会的时候感觉怎么样。
    jacob
        30
    jacob  
       2015-06-06 17:56:52 +08:00
    @nkssai 这是比赛,拿人家的题目训练算法我也是醉了
    mingyun
        31
    mingyun  
       2015-06-07 10:42:15 +08:00
    呵呵
    rushcheyo
        32
    rushcheyo  
       2015-06-07 16:03:35 +08:00
    @1023400273 根本没有所谓的「自然概率」,必须只有依靠量子力学才能得到自然概率,那只有顶级 CPU 才有。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4959 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 09:47 · PVG 17:47 · LAX 02:47 · JFK 05:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.