重新使用已编译的.exe文件中的字符

eli*_*iba 6 c binary dos elf

很久以前,出于好奇,我尝试了十六进制编辑游戏"Dangerous Dave"的可执行文件.我查看了文件中找到的任何字符串,并进行了一些随机编辑,看看它是否真的会改变游戏中显示的文字.

我很惊讶地看到了结果,我现在使用十六进制编辑器和DOSBox重新创建了结果: 在此输入图像描述

可以看出,编辑字符串"ROMERO"中的两个字符"RO"导致4个字符被改变,结果变为"ZUMEZU".似乎程序正在重用这两个字符并在该字符串的开头和结尾打印它们.

这是什么原因?我的第一个猜测是尝试使可执行文件变小,但只是重用字符的代码可能需要比保存的2个字节更多的空间.它只是作者完成的技巧,还是只是一些编译器的巫术?

dus*_*uff 5

如果不进行逆向工程,可以肯定地说,但我的猜测是程序中的很多常量数据都是使用LZ系列的算法压缩的.这些压缩方案基本上以您观察到的方式工作:它们将重复的子字符串编码为对先前已解码的文本的引用.

这些压缩算法可能不仅仅用于这一个字符串,而且不仅仅用于文本; 它们很可能也用于压缩其他数据,例如图形或关卡布局.简而言之,使用此算法可能会节省大量成本!

在旧游戏中使用这些压缩算法是一种节省磁盘空间的方法,但并不是自动的 - 这种算法的实现很可能是Romero自己添加的.