gpt4 book ai didi

python - 通过节点属性使用 getElementsByTagName 后对节点进行排序

转载 作者:行者123 更新时间:2023-11-28 17:53:21 25 4
gpt4 key购买 nike

编辑

字典是这里的罪魁祸首,这个问题上标记的答案是有效的,但字典会做它想做的事。在这种情况下,字典排序是答案,但现在我知道如何通过属性对节点进行排序,你也知道。

结束

我很高兴能问 Python 问题,这是我所拥有的:

def parse_fixed_data(self, format):
return_message = {}
nodes = format.getElementsByTagName('data')
for node in nodes:
return_message[node.attributes['name'].value] = self.raw_message[int(node.attributes['from'].value):int(node.attributes['to'].value)]
return return_message

这几乎是完美的。 “格式”变量是一个已经解析的节点,其中包含一堆“数据”节点。这是 xml:

<pmbmsg id='pmb_header'>
<version maj='01' min='00' rev='0000' type='FIXED' delimeter=''>
<data seq='1' from='0' to='3' name='message_type'/>
<data seq='2' from='3' to='13' name='version'/>
<data seq='3' from='13' to='33' name='from_system'/>
<data seq='4' from='33' to='53' name='to_system'/>
<data seq='5' from='53' to='73' name='family'/>
<data seq='6' from='73' to='83' name='priority'/>
<data seq='7' from='83' to='103' name='msg_format_id'/>
<data seq='8' from='103' to='135' name='msg_unique_id'/>
<data seq='9' from='135' to='161' name='created'/>
<data seq='10' from='161' to='163' name='hop_count'/>
<data seq='11' from='163' to='173' name='original_msg_format_id'/>
<data seq='12' from='173' to='205' name='original_unique_id'/>
<data seq='13' from='205' to='245' name='padding'/>
<data seq='14' from='245' to='4086' name='message_data'/>
</version>
</pmbmsg>

好吧,这一切都很好,但我按以下顺序取回了字典元素:

u'to_system'            
u'padding'
u'original_msg_format_id'
u'original_unique_id'
u'family'
u'created'
u'msg_format_id'
u'hop_count'
u'msg_unique_id'
u'priority'
u'version'
u'from_system'
u'message_type'
u'message_data'

(删除值)

我希望它们按照它们在 xml 中出现的顺序返回,seq 属性可以帮助实现这一点。在 Python 代码的这一行之后:

nodes = format.getElementsByTagName('data')

...是否有一些我可以在节点上运行的函数来对其进行排序?或者在获取节点时我可以说些什么让它知道对它们进行排序?您会认为它会按照编写 xml 的顺序自然而然地获取它吗?

如果没有为我自动神奇地执行此操作的功能,我可以处理它。

最佳答案

节点不按 XML 中的名称排序,这也反射(reflect)在节点列表中。它们将以与迭代相同的顺序出现。根据定义,列表是有序的。字典不是。你遇到的问题是,当你迭代字典键时,你的属性名称是乱序的,除了对字典进行排序之外,没有其他办法解决这个问题。

您可以在处理字典之前对节点进行排序(这仍然不能保证字典本身会被排序):

>>> [node.attributes['name'].value for node in sorted(nodes, key=lambda x: x.attributes['name'].value)]
[u'created', u'family', u'from_system', u'hop_count',
u'message_data', u'message_type', u'msg_format_id', u'msg_unique_id',
u'original_msg_format_id', u'original_unique_id', u'padding', u'priority',
u'to_system', u'version']

或者您可以使用 collections.OrderedDict (在 Python 2.7+ 中可用)而不是普通字典来创建 return_message

# No example because I don't have acces to Python 2.7

或者您可以使用 sorted() 按值对字典进行排序.

>>> import operator
>>> sorted_return_message = sorted(return_message.iteritems(), key=operator.itemgetter(0))
>>> for k,v in sorted_return_message: print k
...
created
family
from_system
hop_count
message_data
message_type
msg_format_id
msg_unique_id
original_msg_format_id
original_unique_id
padding
priority
to_system
version

或者您可以在运行时对键进行排序:

>>> for k in sorted(return_message):
... print k
...
created
family
from_system
hop_count
message_data
message_type
msg_format_id
msg_unique_id
original_msg_format_id
original_unique_id
padding
priority
to_system
version

关于python - 通过节点属性使用 getElementsByTagName 后对节点进行排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5735927/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com