python - Pandas :展平树结构-6ren

python - Pandas :展平树结构

转载作者：行者123 更新时间：2023-12-05 09:05:45

25

4

我有一个由以下表示的类别树。

import pandas as pd

asset_tree = [
    {'id': 1, 'name': 'Linear Asset', 'parent_id': -1},
    {'id': 2, 'name': 'Lateral', 'parent_id': 1},
    {'id': 3, 'name': 'Main', 'parent_id': 1},
    {'id': 4, 'name': 'Point Asset', 'parent_id': -1},
    {'id': 5, 'name': 'Fountain', 'parent_id': 4},
    {'id': 6, 'name': 'Hydrant', 'parent_id': 4}
]
tree = pd.DataFrame(asset_tree)
print(tree)

这给了我一个如下的数据框:

   id          name  parent_id
0   1  Linear Asset         -1
1   2       Lateral          1
2   3          Main          1
3   4   Point Asset         -1
4   5      Fountain          4
5   6       Hydrant          4

树中最高的节点的 parent_id 等于 -1，因此树可以用图形表示如下:

Linear Asset
   | - Lateral
   | - Main
Point Asset
   | - Fountain
   | - Hydrant

我需要生成以下数据框。

   id          name  parent_id  flat_name
0   1  Linear Asset         -1  Linear Asset
1   2       Lateral          1  Linear Asset : Lateral
2   3          Main          1  Linear Asset : Main
3   4   Point Asset         -1  Point Asset
4   5      Fountain          4  Point Asset : Fountain
5   6       Hydrant          4  Point Asset : Hydrant

树是动态生成的，可以有任意数量的层次，所以下面的树

asset_tree = [
    {'id': 1, 'name': 'Linear Asset', 'parent_id': -1},
    {'id': 2, 'name': 'Lateral', 'parent_id': 1},
    {'id': 3, 'name': 'Main', 'parent_id': 1},
    {'id': 4, 'name': 'Point Asset', 'parent_id': -1},
    {'id': 5, 'name': 'Fountain', 'parent_id': 4},
    {'id': 6, 'name': 'Hydrant', 'parent_id': 4},
    {'id': 7, 'name': 'Steel', 'parent_id': 2},
    {'id': 8, 'name': 'Plastic', 'parent_id': 2},
    {'id': 9, 'name': 'Steel', 'parent_id': 3},
    {'id': 10, 'name': 'Plastic', 'parent_id': 3}
]

应该产生以下结果:

   id          name  parent_id  flat_name
0   1  Linear Asset         -1  Linear Asset
1   2       Lateral          1  Linear Asset : Lateral
2   3          Main          1  Linear Asset : Main
3   4   Point Asset         -1  Point Asset
4   5      Fountain          4  Point Asset : Fountain
5   6       Hydrant          4  Point Asset : Hydrant
6   7         Steel          2  Linear Asset : Lateral : Steel
7   8       Plastic          2  Linear Asset : Lateral : Plastic
8   9         Steel          3  Linear Asset : Main : Steel
9  10       Plastic          3  Linear Asset : Main : Plastic

最佳答案

这是一个递归的 apply 函数来完成这个。该函数接受一个 id 并返回它在树中的“路径”:

def flatname(ID):
    row = df[df['id'] == ID].squeeze()
    if row['parent_id'] == -1:
        return row['name']
    else:
        return flatname(row['parent_id']) + ' : ' + row['name']

要使用，调用:

df['flat_name'] = df['id'].apply(flatname)

第二个例子中使用的df:

   id          name  parent_id                         flat_name
0   1  Linear Asset         -1                      Linear Asset
1   2       Lateral          1            Linear Asset : Lateral
2   3          Main          1               Linear Asset : Main
3   4   Point Asset         -1                       Point Asset
4   5      Fountain          4            Point Asset : Fountain
5   6       Hydrant          4             Point Asset : Hydrant
6   7         Steel          2    Linear Asset : Lateral : Steel
7   8       Plastic          2  Linear Asset : Lateral : Plastic
8   9         Steel          3       Linear Asset : Main : Steel
9  10       Plastic          3     Linear Asset : Main : Plastic

OP 注意到上面的函数明确引用了在函数作用域之外定义的 df 变量。因此，如果您将 DataFrame 命名为不同的名称，或者您想在许多 DataFrame 上调用它，这可能会导致问题。一种解决方法是将 apply 函数变成更多的私有(private)助手，并创建一个调用它的外部(对用户更友好的)函数:

def _flatname_recurse(ID, df):
    row = df[df['id'] == ID].squeeze()
    if row['parent_id'] == -1:
        return row['name']
    else:
        return _flatname_recurse(row['parent_id'], df=df) + ' : ' + row['name']

# asset_df to specify we are looking for a specific kind of df
def flatnames(asset_df):
    return asset_df['id'].apply(_flatname_recurse, df=asset_df)

然后调用:

df['flat_name'] = flatnames(df)

另外，请注意我曾经使用 row = df.iloc[ID - 1, :] 来识别行，这在这种情况下有效但依赖于 id 比索引大一。 This approach更通用。

关于python - Pandas :展平树结构，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66784106/

25

4

0

文章推荐： flutter - 如何根据 flutter 更改 fl 图表工具提示位置

文章推荐： r - 在 R 中将凌乱的宽数据转换为长数据

ANTLR4:树结构
我正在扩展 baseClass 监听器并尝试读取一些值，但是顺序中似乎没有任何层次结构。我的语法的精简版如下: start: config_options+ config_options: (KEY
04、XML 树结构
XML文档是一种树形结构，它从根部开始，然后扩展到枝叶一个 XML 文档范例 XML文档使用的是简单的具有自我描述性的语法我们拿之间的小红写给小明的情书作为范例 <?xml v
php - 具有多态关系的多维数组(树结构)
要了解我想做什么，这里有一个简单的解释:我想创建模板。一个"template"有一个“面板”这个“面板”有一些“项目”和另一个“面板”我们必须一步一步地做，直到最后一个“Item” 我想要这样的东西
mysql - 树结构 - 从两个表中获取最后一级数据
我的数据结构如下。 A A1 A2 B B1 C C1 C2 C3 这些信息转移到两个名为group1和group2的表中。 group1有第一层数据和中间层数据。 gro
javascript 树结构 - 遍历树结构并显示子项内计数属性的总和
所以我有一个如下所示的树结构，其中我在叶节点中有一个计数属性。我想总结计数并将计数总和与其父项进行比较。比 parent1 和 parent2 有他们的 child 的总和。然后从那里继续，所以 gr
Javascript 递归(树结构)
我有以下 json : var jsonObj = [ { "parentIndex": '0' ,
无需循环查询的类别和子类别的 PHP 树结构
我正在尝试创建一个包含任意数量子类别的类别列表，其中子类别也可以有自己的子类别。我从 Mysql 数据库中选择了所有类别，猫在标准关联数组列表中，每个类别都有一个 id、名称、parentid，如果
javascript - 动态 Javascript 树结构
我想动态构建层次结构，每个节点创建为层次结构中的一个层/级别，具有自己的节点数组。这应该形成一个树结构。应该有一个根节点，以及未定义数量的节点和级别来构成层次结构大小。除了根节点之外，什么都不应该被修
api - Wikitravel XML 树结构
我正在浏览 Wikitravel API，我注意到他们提供的 XML 文件只是将所有信息集中在一个大 blob 中。示例:http://wikitravel.org/en/Special:Export
iphone - 实现 UITableView 树结构
我正在尝试设置一个UITableView来显示嵌套的线程项目。我正在使用 Core Data 和 NSFetchedResultsController，但不确定我的方法应该是什么。我想显示这样的信息:
sqlite - 查询 SQLite 树结构
我有一个这样的表数据库: tree{id,name,parent}content{id,content,parent}tree 表包含一个树状结构，如果 parent 是 0，它是顶级元素，如果不同，
javascript - 从多级对象数组创建 JSON 树结构
我有一个像这样的 json 对象数组: [{ "vehicleid": 3, "name": "Teste2VDD", "brand": "Scania", "mode
javascript - 使用子级创建 json 树结构
我有一个 json 树结构，通过按此 fiddle 上的调用来附加该结构:http://jsfiddle.net/adrianjsfiddlenetuser/C6Ssa/4/ 按 fiddle 上的调
java - 重新加载 prefuse 树结构？
我需要使用 prefuse 可视化一个 xml 文件，但由于其大小，我必须一次仅加载文件的一部分，并将它们表示为 prefuse 中的树结构。我设法加载并可视化第一棵树，其中包含所有 xml 元素的深
python - 从标识符构建 json 树结构
我有一个包含如下数据的文件: ID attribute 1 'text' 101 'text' 1011 'text' 10111 'text' 1011101 'text' 1011102 'tex
javascript - 从对象数组递归创建 JSON 树结构
这是我的数据结构: { projects: [ { revisions: [ { files: [] }, ], } ], us
javascript - 将对象列表转换为 json 树结构
我有一个列表需要转换成json格式。这个.. var sourceList = [ { title: "item-1", indent: "0" }, { title: "item-
java - OpenCMS - 如何展开平面结构而不是文件夹/树结构
我希望我的内容有一个树/文件夹结构，但希望所有页面都作为一个平面 URL。例如位于/cat1/subcat2/tulips.html 的页面将在以下位置提供: http://example.com/
javascript - 树结构 - Javascript - parent ？
简单来说我有一个由对象组成的树结构。是否可以构建该树并向每个对象添加对其父对象的引用？我知道引用适用于对象，但我不确定在这种情况下是否有效？我希望能够写出这样的东西 currentLevel
ios - Firebase JSON 树结构
我创建了一个涉及学校学生的项目。当我开始构建这个项目时，我遇到了三个主要问题: 1)推荐或更好的 JSON 树结构？ schools grades users(uids) in

首页

博学

6Ren·AI

商城

python - Pandas :展平树结构