Joe*_*Fan 1 encryption cryptography cryptanalysis
我有一些base-64编码的加密数据,并注意到相当多的重复.在(大约)200个字符长的字符串中,某个base-64字符在几次单独的重复运行中重复多达7次.
这是加密问题的红旗吗?根据我的理解,加密数据永远不会显示重复,即使明文是完全统一的(即使我加密2 GB除了字母A之外,加密版本中不应该有重大的重复).
根据二项分布,大约有2.5%的可能性,你会看到一组64个中的一个字符在一系列200个随机字符中出现七次.这是一个很小的机会,但不可忽视.有了更多信息,您可以将信心从97.5%提高到非常接近100%......或者发现密文真的是均匀分布的.
你说的"字符重复最多的几个单独的重复运行7倍".这还不足以说明密文是否存在偏见.相反,请告诉我们角色出现的总次数以及密文字符的总数.例如,"它在1000次运行中总共出现了3125次,每次200个字符."
此外,您需要确保您正在谈论密码的原始输出.密文通常封装在"密码"中,类似于"加密消息语法"定义的"信封".当然,这个封闭结构将具有可预测的模式.