XSLT:获取或匹配 Base64 编码数据的哈希值

bgu*_*uiz 7 xslt hash md5 image-manipulation evernote

我需要找到一种方法来查找 XML 节点//note/resource/data中的 base64 编码数据的哈希值,或者以某种方式将其与节点//note/content/en中的哈希值匹配-note//en-media@hash

请参阅下面的完整 XML 文件

请建议一种使用 XSLT来{获取|匹配}的方法

4aaafc3e14314027bb1d89cf7d59a06c
Run Code Online (Sandbox Code Playgroud)

{来自|与}

R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==
Run Code Online (Sandbox Code Playgroud)

为简洁起见,该示例 XML 文件显然已被删减。每个注释实际可能包含 > 1 个图像,因此需要获取/匹配哈希值。

XML 文件:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-export SYSTEM "http://xml.evernote.com/pub/evernote-export.dtd">
<en-export export-date="20091029T063411Z" application="Evernote/Windows" version="3.0">

<note>
    <title>A title here</title>
    <content><![CDATA[
        <?xml version="1.0" encoding="UTF-8"?>
        <!DOCTYPE en-note SYSTEM "http://xml.evernote.com/pub/enml.dtd">
        <en-note bgcolor="#FFFFFF">
            <p>Some text here (followed by the picture)
            <p><en-media hash="4aaafc3e14314027bb1d89cf7d59a06c" type="image/gif" border="0" width="16" height="16" alt="A picture"/></p>
            <p>Some more text here (preceded by the picture)
        </en-note>
    ]]></content>
    <created>20090925T063154Z</created>
    <note-attributes>
        <author/>
    </note-attributes>
    <resource>
        <data encoding="base64">
R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==
        </data>
        <mime>image/gif</mime>
        <resource-attributes>
            <file-name>clip_image001.gif</file-name>
        </resource-attributes>
    </resource>
</note>

</en-export>
Run Code Online (Sandbox Code Playgroud)

实施的解决方案

使用Jackem建议的解决方案的概念。主要区别在于我避免创建自己的 Java 类(并创建额外的依赖项)。我在 XSLT 中进行处理,因为它足够简单,仅引用基本 Java 库附带的外部依赖项。
Jackem 的解决方案更正确,因为它不会丢失某些哈希中的前导零,但是我发现使用基本的黑客技术在其他地方处理这个问题要容易得多。

<xsl:stylesheet version="2.0" 
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    ...
    xmlns:md5="java.security.MessageDigest"
    xmlns:bigint="java.math.BigInteger"
    exclude-result-prefixes="md5 bigint">
...
<xsl:for-each select="resource">
    <xsl:variable name="md5inst" select="md5:getInstance('MD5')" />
    <xsl:value-of select="md5:update($md5inst, $b64bin)" />
    <xsl:variable name="imgmd5bytes" select="md5:digest($md5inst)" />
    <xsl:variable name="imgmd5bigint" select="bigint:new(1, $imgmd5bytes)" />
    <xsl:variable name="imgmd5str" select="bigint:toString($imgmd5bigint, 16)" />
    <!-- NOTE: $imgmd5str loses the leading zero from imgmd5bytes (if there is one) -->
</xsl:for-each>
...
Run Code Online (Sandbox Code Playgroud)

PS 请参阅我的转换实现的兄弟问题base64-->image file


这个问题是我之前问过的另一个问题 的子问题。

Juk*_*nen 4

对于您的相关问题\xc2\xa0about 在 XSLT 中进行 base64 解码,您已接受使用 Saxon 和 Java 扩展的答案。所以我假设你可以使用这些。

\n\n

在这种情况下,您可以用 Java 创建一个扩展来计算 MD5 和:

\n\n
package com.stackoverflow.q1684963;\n\nimport java.math.BigInteger;\nimport java.security.MessageDigest;\nimport java.security.NoSuchAlgorithmException;\n\npublic class MD5Sum {\n    public static String calc(byte[] data) throws NoSuchAlgorithmException {\n        MessageDigest md5 = MessageDigest.getInstance("MD5");\n        byte[] digest = md5.digest(data);\n        BigInteger digestValue = new BigInteger(1, digest);\n        return String.format("%032x", digestValue);\n    } \n}\n
Run Code Online (Sandbox Code Playgroud)\n\n

然后,您可以从使用 Saxon 运行的 XSLT 2.0 样式表中调用该扩展。假设您已经在变量中拥有 base64 解码的数据(例如来自saxon:base64Binary-to-octets链接答案中的扩展函数)data

\n\n
<xsl:value-of xmlns:md5sum="com.stackoverflow.q1684963.MD5Sum"\n              select="md5sum:calc($data)"/>\n
Run Code Online (Sandbox Code Playgroud)\n

  • 值得赞扬的地方:Java代码改编自问题http://stackoverflow.com/questions/332079/in-java-how-do-i-convert-a-byte-array-to-a-的各种答案保持文件时的十六进制数字串 (4认同)