gpt4 book ai didi

Python:如何为 XML 文档生成唯一标识符?

转载 作者:太空宇宙 更新时间:2023-11-04 05:49:06 25 4
gpt4 key购买 nike

XSLT 有一个 generate-id(xml-document) 函数。有了它,我可以为 XML 文档创建一个唯一标识符。

在 Python 中,我如何为 XML 文档生成唯一标识符?

注意:唯一标识符应该基于XML文档的内容,而不是XML文档的文件名。例如,这个 XML 文档

<root>
<comment>Hello, World</comment>
</root>

和这个 XML 文档

<document>
<test>Blah, Blah</test>
</document>

必须生成不同的标识符,即使它们的文件名相同。

我有一张 XML 文档图。所以我需要一些方法来识别,“嘿,我已经看过这个 XML 文档了。”我不想比较整个 XML 文档。相反,我想比较对应于 XML 的 UUID。

最佳答案

一个同事刚刚给我发了答案:

For mapping text to an ID, we’ve used MD5 as one hash digest. Give the md5() function an XML document (string) and it will return a 32-character identifier.

更多详情:


基因.py
import sys
import stdio
from hashlib import md5

def digest_md5(obj):
if type(obj) is unicode:
obj = obj.encode('utf8')
return md5(obj).hexdigest()

s = sys.stdin.readline()
stdio.writeln(digest_md5(s))

然后我把它变成了一个exe文件。

然后在 DOS 命令提示符下我输入了这个命令:

type input.txt | genid

其中 input.txt 是:

<Document>Hello, World</Document>

我得到了这个输出:

df6f8283335bf3f657a89733e3d36b84

漂亮!

关于Python:如何为 XML 文档生成唯一标识符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31072092/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com