匿名程序员能通过分析编程风格识别身份

2015-01-22 18:33:28 +08:00
 leloext

在学习计算机编程过程中,每一位程序员都培养出了一种独一无二的编程风格。这种编程风格是一种可作为身份识别的“指纹”,通过分析编程风格,匿名程序员能被识破身份。来自Drexel大学、普林斯顿大学和哥廷根大学的研究人员发表了一篇论文(PDF),分析了一个250名程序员的数据集,每位程序员平均写了630行代码。通过组合选择变量名的词汇特征、行间布局特征和语法风格,研究人员能以95%的精度确认匿名代码的作者。
http://www.solidot.org/story?sid=42785

略怕,github上的同学们要做好保密啊。

2687 次点击
所在节点    分享发现
12 条回复
amaranthf
2015-01-22 18:52:47 +08:00
250个样本没什么价值,风格这种东西都是随时变的,比如我写C代码和写py代码就是两种完全不同的风格,哪天犯懒了没准还混用一把,另外行间布局特征还和ide有很大关系,比如vs2013会自动给我加上空格,codemaid插件会自动清空行之类的……变数太大,谈精确识别完全不靠谱。
yangff
2015-01-22 19:34:16 +08:00
@amaranthf 混用和变化也是风格的一部分!
virusdefender
2015-01-22 20:32:24 +08:00
这个技术早就被用在了恶意软件识别上。两个软件可以分析是不是一个人的
jedihy
2015-01-22 21:23:31 +08:00
@amaranthf 这就是你的风格
FrankFang128
2015-01-22 21:36:24 +08:00
人类也可以从行文风格看出作者啊。
sneezry
2015-01-22 21:39:17 +08:00
通过加密时计算机风扇声音的大小破解加密算法,我觉得还是这个屌。
fecho
2015-01-22 21:41:43 +08:00
@sneezry 看到这个想到 通过屁味识别一个人 - -
asfhkoashf
2015-01-22 22:27:10 +08:00
@sneezry 我记得看过一篇文章 高速录像机 录物体振动的幅度大小 然后能计算出来声音..
yksoft1
2015-01-22 22:32:11 +08:00
@sneezry 典型的副信道攻击
Heracles
2015-01-22 22:33:47 +08:00
@amaranthf 你以为你写字换个风格别人就看不出来了,实际上可以
mengzhuo
2015-01-23 08:27:33 +08:00
那有官方fmt的golang 怎么破?
aaaa007cn
2015-01-23 22:20:09 +08:00
@mengzhuo
“通过组合选择变量名的词汇特征、行间布局特征和语法风格”
go fmt 只能消除一部分的“行间布局特征”

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/164578

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX