gpt4 book ai didi

XSLT:获取或匹配 base64 编码数据的哈希值

转载 作者:行者123 更新时间:2023-12-05 00:42:54 25 4
gpt4 key购买 nike

我需要找到一种方法来找到一种方法来找到 XML 节点 中 base64 编码数据的哈希值//注意/资源/数据 ,或以其他方式将其与节点中的哈希值匹配 //note/content/en-note//en-media@hash

请参阅下面的完整 XML 文件

请提出一种{获得|匹配}的方法使用 XSLT

4aaafc3e14314027bb1d89cf7d59a06c

{来自|与}
R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==

为简洁起见,此示例 XML 文件显然已被修剪。实际每个音符可能包含 > 1 个图像,因此需要获取/匹配哈希值。

XML文件:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-export SYSTEM "http://xml.evernote.com/pub/evernote-export.dtd">
<en-export export-date="20091029T063411Z" application="Evernote/Windows" version="3.0">

<note>
<title>A title here</title>
<content><![CDATA[
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-note SYSTEM "http://xml.evernote.com/pub/enml.dtd">
<en-note bgcolor="#FFFFFF">
<p>Some text here (followed by the picture)
<p><en-media hash="4aaafc3e14314027bb1d89cf7d59a06c" type="image/gif" border="0" width="16" height="16" alt="A picture"/></p>
<p>Some more text here (preceded by the picture)
</en-note>
]]></content>
<created>20090925T063154Z</created>
<note-attributes>
<author/>
</note-attributes>
<resource>
<data encoding="base64">
R0lGODlhEAAQAPMAMcDAwP/crv/erbigfVdLOyslHQAAAAECAwECAwECAwECAwECAwECAwECAwEC
AwECAyH/C01TT0ZGSUNFOS4wGAAAAAxtc09QTVNPRkZJQ0U5LjAHgfNAGQAh/wtNU09GRklDRTku
MBUAAAAJcEhZcwAACxMAAAsTAQCanBgAIf8LTVNPRkZJQ0U5LjATAAAAB3RJTUUH1AkWBTYSQXe8
fQAh+QQBAAAAACwAAAAAEAAQAAADSQhgpv7OlDGYstCIMqsZAXYJJEdRQRWRrHk2I9t28CLfX63d
ZEXovJ7htwr6dIQB7/hgJGXMzFApOBYgl6n1il0Mv5xuhBEGJAAAOw==
</data>
<mime>image/gif</mime>
<resource-attributes>
<file-name>clip_image001.gif</file-name>
</resource-attributes>
</resource>
</note>

</en-export>

实现方案

使用 Jackem 建议的解决方案的概念.主要区别在于我避免创建自己的 Java 类(并创建额外的依赖项)。我在 XSLT 中进行处理,因为它足够直接,只引用基本 Java 库附带的外部依赖项。
Jackem 的解决方案更正确,因为它不会丢失某些哈希中的前导零,但是我发现在其他地方使用 li'l basichackery 处理这个问题要容易得多。
<xsl:stylesheet version="2.0" 
xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
...
xmlns:md5="java.security.MessageDigest"
xmlns:bigint="java.math.BigInteger"
exclude-result-prefixes="md5 bigint">
...
<xsl:for-each select="resource">
<xsl:variable name="md5inst" select="md5:getInstance('MD5')" />
<xsl:value-of select="md5:update($md5inst, $b64bin)" />
<xsl:variable name="imgmd5bytes" select="md5:digest($md5inst)" />
<xsl:variable name="imgmd5bigint" select="bigint:new(1, $imgmd5bytes)" />
<xsl:variable name="imgmd5str" select="bigint:toString($imgmd5bigint, 16)" />
<!-- NOTE: $imgmd5str loses the leading zero from imgmd5bytes (if there is one) -->
</xsl:for-each>
...

附言见 sibling question为我实现 base64-->image file转换

这个问题是 another question I have asked previously的子问题.

最佳答案

有关在 XSLT 中进行 base64 解码的相关问题,您有 accepted an answer它使用 Saxon 和 Java 扩展。所以我假设你可以使用这些。

在这种情况下,您可以在 Java 中创建一个扩展来计算 MD5 总和:

package com.stackoverflow.q1684963;

import java.math.BigInteger;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

public class MD5Sum {
public static String calc(byte[] data) throws NoSuchAlgorithmException {
MessageDigest md5 = MessageDigest.getInstance("MD5");
byte[] digest = md5.digest(data);
BigInteger digestValue = new BigInteger(1, digest);
return String.format("%032x", digestValue);
}
}

从与 Saxon 一起运行的 XSLT 2.0 样式表中,您可以调用该扩展。假设您已经在变量 saxon:base64Binary-to-octets 中拥有 base64 解码数据(例如来自扩展函数 data,如链接的答案中所示) :
<xsl:value-of xmlns:md5sum="com.stackoverflow.q1684963.MD5Sum"
select="md5sum:calc($data)"/>

关于XSLT:获取或匹配 base64 编码数据的哈希值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1684963/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com