gpt4 book ai didi

Python:树结构和数字代码?

转载 作者:太空狗 更新时间:2023-10-29 22:10:06 24 4
gpt4 key购买 nike

我正在使用 Python,并且我有一些数据想放入树格式并为其分配代码。以下是一些示例数据:

Africa    North Africa    Algeria
Africa North Africa Morocco
Africa West Africa Ghana
Africa West Africa Sierra Leone

什么是适合此数据的树结构?

另外,有没有一种方法可以从这个树结构中检索数字代码,以便我可以查询数据并获取代码,如下例所示?

def get_code(place_name):
# Python magic query to my tree structure
return code
get_code("Africa") # returns 1
get_code("North Africa") # returns 1.1
get_code("Morocco") # returns 1.1.2

谢谢你的帮助——关于 Python 我还有很多要学:)

最佳答案

我会建议,假设您可以指望名称之间没有重复,例如:

class Node(object):
byname = {}

def __init__(self, name, parent=None):
self.name = name
self.parent = parent
self.children = []
self.byname[name] = self
if parent is None: # root pseudo-node
self.code = 0
else: # all normal nodes
self.parent.children.append(self)
self.code = len(self.parent.children)

def get_codes(self, codelist):
if self.code:
codelist.append(str(self.code))
self.parent.get_codes(codelist)

root = Node('')

def get_code(nodename):
node = Node.byname.get(nodename)
if node is None: return ''
codes = []
node.get_codes(codes)
codes.reverse()
return '.'.join(codes)

您是否还想查看 Python 代码,了解如何在给定名称层次序列的情况下添加节点,例如 ['Africa', 'North Africa', 'Morocco']?我希望上面的结构会很清楚,所以你可能想自己做一个练习,但当然要问问你是否更愿意看到一个解决方案;-)。

从文本行(字符串)中获取名称的层次序列取决于分隔符是什么——在你的例子中,它看起来只是为了纯粹的美学原因而添加的一堆空格,与列的排列有关(如果那是在这种情况下,我会推荐一种基于 re 的简单方法来拆分两个以上空格的序列),但如果它实际上(例如)制表符作为分隔符,则 csv 模块来自 Python 的标准库会更好地为您服务。我只是无法从您在 Q 中发布的简短示例中分辨出来!-)

编辑:OP 表示他们可以很好地获得名称序列,但希望看到代码以从中添加相关节点——所以,开始吧!-)

def addnodes(names):
parent = root
for name in names:
newnode = Node.byname.get(name)
if newnode is None:
newnode = Node(name, parent)
parent = newnode

明白为什么节点名称是唯一的对于使上述类工作很重要吗?由于 Node.byname 是一个单一的类 dict,它只能为每个给定的名称记录一个“对应的节点”——因此,一个名称在两个或层次结构中更多的地方会“冲突”,只有两个或多个节点中的一个会被正确记录。

但话又说回来,OP 所说的函数 get_code 是整个设备无法按预期工作的主要原因,如果名称可能不明确,因为 OP 的规范要求它只返回一个 字符串。所以,一些地理列表,比如

America   United States    Georgia
Europe Eastern Europe Georgia

(两个完全不相关的区域碰巧都被命名为'Georgia'——不幸的是,这种事情在现实世界的地理中经常发生,因为上面的例子显示!-) 会破坏整个方案(取决于如何更改 get_code 的规范以处理名称不明确的参数,当然,类结构肯定会被更改相应地适应新的、截然不同的规范!)。

将这些设计决策封装在一个类中的好处(尽管在这种情况下有几个附带的函数——当然,它们可以优雅地变成类方法,但是 OP 的规范严格要求 get_code 是一个函数,所以我决定,在那种情况下 addnodes 也可能是一个!-) 是特定的设计决策大部分隐藏在其余代码中,并且因此可以很容易地改变(当然,只要规范永远不变——这就是为什么花时间和精力定义一个 API 规范如此重要的原因,这比在设计和编码的任何部分花费更多的时间和精力) !-) 重构内部行为(例如为了优化、便于调试/测试等),同时保持 API 指定的语义完整,从而使应用程序的所有其他部分保持原始状态(实际上甚至不需要重新测试) ,当然只要实现 API 的部分经过非常彻底的单元测试——n不难做到,因为它们很好地隔离并且独立!-)。

关于Python:树结构和数字代码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3753665/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com