V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xupefei  ›  全部回复第 75 页 / 共 132 页
回复总数  2628
1 ... 71  72  73  74  75  76  77  78  79  80 ... 132  
2018-04-26 03:34:26 +08:00
回复了 kamen 创建的主题 奇思妙想 使用 AI 来识别文件格式
@msg7086 #31 你这还是有点儿慢。终极方案还是得靠记事本:
运行记事本,把文件拖进去,观察前几个字,天啦噜是 XXX。

另外,我现在就是这么干的,因为常见的 magic 都挺好记的。
题外话,把 exe/dll 拖到记事本里有时会有有趣的发现,比如作者的变量命名喜好、有趣的字符串、残留的 gdb 符号路径暴漏了开发者的名字之类的……
2018-04-26 03:15:48 +08:00
回复了 kamen 创建的主题 奇思妙想 使用 AI 来识别文件格式
另外,我觉得可以提一下 magic 识别有多简单,肯定比跑 AI 快:

var magic=文件前四字节
if magic=="GIF8"
return "GIF"
else if magic=="\x89PNG"
return "PNG"
else if magic=="PK\x03"
return "ZIP"

下次添加新类型,只需要写两行代码。
2018-04-26 03:07:34 +08:00
回复了 kamen 创建的主题 奇思妙想 使用 AI 来识别文件格式
@kamen #20 数据能成为特征,例如 xml、txt 和 wav。
然而,现在绝大部分文件都不是直接存的,而是有一个压缩过程。压缩后的字节你说能有什么特征?
某些分段压缩的文件中间会出现特征。例如,PNG 文件内会出现“ fcTL ”、“ fdAT ”之类的明文,但是人家头部已经有 magic 了,要中间的特征何用?

我的思路如下:
1 ) Q:这是个问题吗? A:不是,因为 magic 判断没有什么明显缺点。
2 ) Q:如何解决这个问题? A:既然不是问题,那么不需要解决。

至于你说“自定义文件格式”,那只能说,首先你就不应该这样设计。
2018-04-26 02:55:20 +08:00
回复了 kamen 创建的主题 奇思妙想 使用 AI 来识别文件格式
@xupefei #18 你可以给一个函数考虑文件中间的特征,但这个函数很可能会对其他文件判断的正确性造成影响。
说白了就是,大家都把特征放在头部,你不放,那是你设计有问题。
2018-04-26 02:52:52 +08:00
回复了 kamen 创建的主题 奇思妙想 使用 AI 来识别文件格式
@kamen 世界上成千上万种格式特征都在头部,你一种格式大概会被当作噪音忽略。
2018-04-26 02:37:48 +08:00
回复了 kamen 创建的主题 奇思妙想 使用 AI 来识别文件格式
照这个思路下来,说不定训练出的 AI 决定只用了这张图的前 32 个点,因为那里是 Magic ……
2018-04-26 00:10:17 +08:00
回复了 jiezhi 创建的主题 优惠信息 新的 Mac App Bundles,入手 PDF Expert 的好机会
买了个 PDF expert 用了用,后悔了。
这么点儿功能只能摸摸 x-change pdf editor 的脚后跟。
2018-04-25 06:05:19 +08:00
回复了 vincentjie 创建的主题 职场话题 咨询一下人工智能(机器学习)的就业情况
@swulling 其实博士也是调参数,只是更加专业😂
你这字体是不是网上自制的?换一个系统自带的。
@Pastsong #38 程度是不一样的。JS 玩出花还是混淆,再混淆还是 JS。看不懂也可以,至少可以找到输入输出黑盒试一试。
现在有个 C++放出来给你反编译,你面对编译器优化出的海量汇编代码,能深入到哪一步?再来个加了 VM 壳的 C++程序,想看到汇编都得折腾到半死。
2018-04-23 17:18:54 +08:00
回复了 woshichuanqilz 创建的主题 Python 如何提取一个 pdf 文件里面, 一个表格的信息?
用 Word 打开这个 PDF 就行了。
2018-04-23 14:28:07 +08:00
回复了 Livid 创建的主题 奇思妙想 最近打算做的一个关于 Time Series DB 的试验
比较 SQL 和 NoSQL,schema 和 schema-free 需要特别设计数据,因为设计不好的数据直接会造成不平等的比较。Time series benchmarking 在学术界也是个很新的领域,鲜有研究。
给你一篇参考:ftp://ftp.informatik.uni-stuttgart.de/pub/library/medoc.ustuttgart_fi/DIP-3729/DIP-3729.pdf
安卓吧。Windows hook 对操作系统底层要求很高。比如你首先得看懂汇编。
2018-04-20 22:08:25 +08:00
回复了 wvc 创建的主题 汽车 有欣赏不来劳斯莱斯的吗?
https://i.imgur.com/wJHLCx4.png
求哪位施舍一辆,我来批判一下。
2018-04-20 18:59:27 +08:00
回复了 dark456852 创建的主题 macOS 由于黑苹果升级系统,关于备份应用问题
Carbon Copy Cloner 能备份 efi 分区之外的数据。
2018-04-20 14:59:07 +08:00
回复了 v2byy 创建的主题 C 在哪里可以精确找到 win32 定义的一些常量, 知道位于哪个头文件中?
@v2byy 你确定 C#可以 interop 头文件里的常量?
1 ... 71  72  73  74  75  76  77  78  79  80 ... 132  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1325 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 51ms · UTC 23:56 · PVG 07:56 · LAX 16:56 · JFK 19:56
Developed with CodeLauncher
♥ Do have faith in what you're doing.