python - Pandas:高效地将一行拆分为多行-6ren

python - Pandas:高效地将一行拆分为多行

转载作者：太空宇宙更新时间：2023-11-03 11:24:04

27

4

我目前面临的问题是采用 pandas DataFrame 并有效地获取每条记录并将其按以下方式分解为多条记录:

输入:

In [16]: pd.DataFrame({'Name': 'Person1', 'State': 'Indiana', 'Money1': 100.42, 'Money2':54.54, 'Money3': 23.45}, index=[1])
Out[16]: 
   Money1  Money2  Money3  Name     State
1  100.42  54.54   23.45   Person1  Indiana

输出:

   Money1  Money2  Money3  Name     State
1  100.42  np.nan  np.nan  Person1  Indiana 
2  np.nan  54.54   np.nan  Person1  Indiana      
3  np.nan  np.nan  23.45   Person1  Indiana

本质上，问题是将原始记录拆分为 x 条记录，其中 x 是要拆分的传入列的列表(在本例中为“Money1”、“Money2”、“Money3”。我尝试通过创建DataFrames 并连接它们，但这非常慢且内存效率低下。

编辑1:

请注意，即使您的静态列之一(已转换为多索引的列)充满了 NaN，答案也不起作用。这是 Pandas 中报告的错误: https://github.com/pydata/pandas/issues/6322

要绕过它，请使用 fillna 或 replace 将完全由 NaN 组成的列填充为空字符串 ''，例如，然后在此过程之后，将 NaN 放回。

最佳答案

这应该适用于具有任意列数的数据框。

df = pd.DataFrame({'Name': ['Person1', 'Person2'], 
                   'State': ['Indiana', 'NY'], 
                   'Money1': [100.42, 200], 
                   'Money2': [54.54, 25], 
                   'Money3': [23.45, 10]})

index_cols = ['Name', 'State']
cols = [c for c in df if c not in index_cols]

df2 = df.set_index(index_cols).stack().reset_index(level=2, drop=True).to_frame('Value')

df2 = pd.concat([pd.Series([v if i % len(cols) == n else np.nan 
                            for i, v in enumerate(df2.Value)], name=col) 
                 for n, col in enumerate(cols)], axis=1).set_index(df2.index)

>>> df2.reset_index()
      Name    State  Money1  Money2  Money3
0  Person1  Indiana       1     NaN     NaN
1  Person1  Indiana     NaN      55     NaN
2  Person1  Indiana     NaN     NaN      23
3  Person2       NY       2     NaN     NaN
4  Person2       NY     NaN      25     NaN
5  Person2       NY     NaN     NaN      10

关于python - Pandas:高效地将一行拆分为多行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37198847/

27

4

0

文章推荐： c# - 在C#中并行运行循环需要什么条件？

文章推荐： mysql - SQL - 从周一到周日按工作日对 DATE_FORMAT 进行排序

文章推荐： c# - 创建线程时如何修复 CurrentUICulture

文章推荐： mysql - 可以使用 SELECT 查询，但不能使用它来创建新表

java - Arraylist 分为 -
我有一个数组列表: ArrayList allText = new ArrayList(); 其内容是这样的: [Alabama - Montgomery, Alaska - Juneau, Ariz
php - 开始和结束时间，分为 1 小时段
我有一个 timestamp 格式的开始和结束时间。我想将它们分成多个时间段，例如 1 小时。 $t1 = strtotime('2010-05-06 12:00:00'); $t2 = strtot
css - span10 分为 3 列
我需要将 span10 分成 3 列，但我无法将它们排列起来。我应该在 span10 中添加一个 span12 还是使用 offset 还是？？
Pandas - 分为 24 小时区 block ，但不是午夜到午夜
我有一个时间序列。我想从早上 8 点到第二天早上 7:59 分成 24 小时的区 block 。我知道如何按日期分组，但我尝试过使用 TimeGroupers 和 DateOffsets 处理这个 8
java - Android Java 分为 4 个整数
我收到“街道号码邮政编码城市”形式的地址(作为字符串)。我想要做的是将街道和号码与邮政编码和城市分开。通常你可以按空格分割。但有些街道名称中也有空格，例如:“Emile Van Ermengemlaa
java - 将 JList 分为 2 组的优化方法
我有一个用户列表。其中一些用户处于第一状态，而其他用户处于第二状态。所以我想要的是将这个列表显示为首先，它按排序顺序显示存在 = 1 的用户，然后按排序顺序显示存在 = 2 的用户。这里的排序是根据用
javascript - 将 div 分为 3 列
我感觉我搜索了整个网络，但找不到一种方法将不同高度的 div 很好地划分为 3 列，就像 http://www.ing.nl 上那样 headertekst headerteksttesth
css - td 内的 Bootstrap 按钮下拉菜单，分为 2 行
Bootstrap 3 按钮下拉菜单出现问题。你可以在这里看到我的两个例子: http://www.bootply.com/W1dLusilMk http://www.bootply.com/GGBv
javascript - 返回的 php JSON 分为 2 个 Javascript 对象
我在 php 中执行以下操作 foreach($QuestionAsekd as $k => $v){ $grp_name = $v['NAME']; $groupValues[$gr
python - Pandas DataFrame [cell=(label,value)]，分为 2 个独立的数据框
我找到了一种用pandas解析html的绝妙方法。我的数据格式有点奇怪(见下文)。我想将这些数据拆分为 2 个单独的数据帧。注意每个单元格如何由，分隔...是否有任何真正有效的方法来分割所有这些单元
html - CSS
分为 2 列。没有

首页

博学

6Ren·AI

商城

python - Pandas:高效地将一行拆分为多行