mon*_*ksy 2 file-format pattern-recognition artificial-intelligence reverse-engineering cluster-analysis
这是为了扩展问题:帮助逆向工程二进制文件格式的工具
是否有任何公开可用的工具使用群集和/或数据挖掘技术来反向工程文件格式?
例如,使用该工具,您将拥有一组具有相同格式的文件,并且该工具的输出将是通用结构?
如果有一个真正有效的二进制编码格式(ZIP文件就是一个例子),那么每个位的信息内容都很高.从本质上讲,它看起来像一个完美的随机数.
没有额外的知识,你不能从中推断出任何东西.
如果二进制编码效率不高,理论上,你有一些看到结构的机会微乎其微.但这仍然听起来很难; 你怎么开始猜测田地的边界在哪里?
AI机器学习类型会告诉你,除非你已"几乎"知道它,否则你无法学到任何东西.通常他们通过编码问题代码的问题来成功,至少你可以推理.
我不认为你可以在没有提供更多信息的情况下做到这一点.你对文件格式有什么了解吗?字段大小总是小于N位?只编码ASCII字符串,反之亦然?