使用加密哈希函数之前和之后

Question

使用加密哈希函数之前和之后

Que*_*ger 4 java hex checksum bytearray cryptographic-hash-function

在查看了多个用于生成 Java MD5 和 SHA* 散列的在线参考资料后，我注意到纯文本（文件字符串）在被馈送到 Digest 对象以生成散列之前和之后经过了一定的准备。具体来说，数据首先转换为字节数组，然后馈送到摘要，然后输出哈希转换为十六进制流。为什么所有这些字节和十六进制转换？

PS：我想答案与 Java 和 Digest 对象如何开展业务有关，我提出这个问题的动机是为了理解这种行为，并可能获得对一些文档/文献的引用，这些文档/文献对此进行了深入解释.

丹克！

Answer 1

Cam*_*ner 5

这有两个部分：

为什么我们在消化之前将字符串转换为字节数组？
为什么我们将摘要转换为十六进制？

第一个答案是摘要仅适用于字节数组。他们不了解字符串、数字或任何其他数据类型。只是字节。因此，我们获取一个String对象并使用某种形式的文本编码（例如 UTF-8）将其转换为字节数组。

请注意，编码很重要：我可以用 UTF-8、UTF-16、US-ASCII 或任意数量的其他编码对字符串“hello world”进行编码。如果我选择 UTF-8，它将生成 11 个字节的输出（因为“hello world”是 11 个字符长），但 UTF-16 将生成 22 个字节的输出。这两种编码会产生不同的摘要，因此了解编码至关重要。

第二个答案是，摘要通常用于基于字符串的协议（例如 HTTP cookie）中，用于在数据库的文本列中存储密码散列，用于将 PGP 签名添加到电子邮件消息等。

由于摘要生成原始字节数组，因此需要将其重新编码为文本友好的内容。这就是使用十六进制（或更可能是 base-64）的原因。

例如，以“hello world”为例，假设 UTF-8 编码的摘要变成了具有以下值的字节数组：（4 27 125 8 0 22 90 7对于我神话般的 8 字节摘要函数）。如果我试图将其解释为 UTF-8 字符串，那么我会得到很多垃圾：0 不是可打印的字符。以十六进制编码意味着我可以以有意义的方式将其打印出来，或者将其添加到我的 PGP 电子邮件中，或其他任何方式。

那有意义吗？

归档时间：	12 年，10 月前
查看次数：	943 次
最近记录：	9 年，7 月前