python - 如何将pandas数据框的单列拆分为带有组的多列？-6ren

python - 如何将pandas数据框的单列拆分为带有组的多列？

转载作者：行者123 更新时间：2023-11-30 22:30:09

33

4

我是 python pandas 的新手。我有一个如下所示的数据框:

df = pd.DataFrame({'Name': ['football', 'ramesh','suresh','pankaj','cricket','rakesh','mohit','mahesh'],
               'age': ['25', '22','21','32','37','26','24','30']})
print df

       Name age
0  football  25
1    ramesh  22
2    suresh  21
3    pankaj  32
4   cricket  37
5    rakesh  26
6     mohit  24
7    mahesh  30

“名称”列还包含“运动名称”和“运动人物名称”。我想将其分成两个不同的列，如下所示:

预期输出:

sports_name sport_person_name age
football    ramesh            25
            suresh            22
            pankaj            32
cricket     rakesh            26
            mohit             24
            mahesh            30

如果我在“名称”列上进行分组，我不会得到预期的输出，并且它显然是直接输出，因为“名称”列中没有重复项。我需要使用什么才能获得预期的输出？

编辑:如果不想对运动名称进行硬编码

df = pd.DataFrame({'Name': ['football', 'ramesh','suresh','pankaj','cricket','rakesh','mohit','mahesh'],
           'age': ['', '22','21','32','','26','24','30']})

df = df.replace('', np.nan, regex=True)

nan_rows = df[df.isnull().T.any().T]
sports = nan_rows['Name'].tolist()

df['sports_name'] = df['Name'].where(df['Name'].isin(sports)).ffill()
d = {'Name':'sport_person_name'}
df = df[df['sports_name'] != df['Name']].reset_index(drop=True).rename(columns=d)
df = df[['sports_name','sport_person_name','age']]
print (df)

我刚刚检查了除了“名称”列之外的所有其余列中包含 NAN 值的行，并且它肯定是体育名称。我创建了该运动名称的列表，并利用以下解决方案创建 sports_name 和 sports_person_name 列。

最佳答案

您可以使用:

#define list of sports
sports = ['football','cricket']
#create NaNs if no sport in Name, forward filling NaNs
df['sports_name'] = df['Name'].where(df['Name'].isin(sports)).ffill()
#remove same values in columns sports_name and Name, rename column
d = {'Name':'sport_person_name'}
df = df[df['sports_name'] != df['Name']].reset_index(drop=True).rename(columns=d)
#change order of columns
df = df[['sports_name','sport_person_name','age']]
print (df)
  sports_name sport_person_name age
0    football            ramesh  22
1    football            suresh  21
2    football            pankaj  32
3     cricket            rakesh  26
4     cricket             mohit  24
5     cricket            mahesh  30

与 DataFrame.insert 类似的解决方案- 那么不需要重新排序:

#define list of sports
sports = ['football','cricket']
#rename column by dict
d = {'Name':'sport_person_name'}
df = df.rename(columns=d)
#create NaNs if no sport in Name, forward filling NaNs
df.insert(0, 'sports_name', df['sport_person_name'].where(df['sport_person_name'].isin(sports)).ffill())
#remove same values in columns sports_name and Name
df = df[df['sports_name'] != df['sport_person_name']].reset_index(drop=True)
print (df)
  sports_name sport_person_name age
0    football            ramesh  22
1    football            suresh  21
2    football            pankaj  32
3     cricket            rakesh  26
4     cricket             mohit  24
5     cricket            mahesh  30

如果只需要一个 sport 值，请将 limit=1 添加到 ffill 并将 NaN 替换为空字符串:

sports = ['football','cricket']
df['sports_name'] = df['Name'].where(df['Name'].isin(sports)).ffill(limit=1).fillna('')
d = {'Name':'sport_person_name'}
df = df[df['sports_name'] != df['Name']].reset_index(drop=True).rename(columns=d)
df = df[['sports_name','sport_person_name','age']]
print (df)
  sports_name sport_person_name age
0    football            ramesh  22
1                        suresh  21
2                        pankaj  32
3     cricket            rakesh  26
4                         mohit  24
5                        mahesh  30

关于python - 如何将pandas数据框的单列拆分为带有组的多列？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46149019/

33

4

0

文章推荐： PHP - 购买后从数据库中清除购物车

文章推荐： php - 如何从 mark php 生成排名？

文章推荐： c# - 代表一个巨大的矩阵/表格

文章推荐： c# - BackgroundWorker 是否有可能等待另一个？

php - 使用PDO提取单行，单列
我有一个针对单行中的单个列的mysql查询 "SELECT some_col_name FROM table_name WHERE user=:user" 执行语句$stmt->execute();后
ios - 多页核心文本解析器(单列)
我想创建一个应用程序，以这种格式在核心文本(滑动到下一页)中显示捆绑文本文件: 旁遮普语文本旁遮普语音译成英语旁遮普语翻译成英语但我希望用户能够通过设置选项卡选择显示的语言，我知道该怎么做，即
ag-grid 单列，将列扩展到网格宽度
我已经在 Angular 应用程序中设置了一个 ag-grid。我正在尝试使单列填充网格的整个宽度。但后来我明白了。
macos - 单列 CSV 文件是否有逗号？
当我在 excel 中打开我的 csv 文件时，它看起来像这样 - header 值 1值2值3值4值5 我想知道这个文件中是否真的有逗号？我知道如果我有多个列，我会看到逗号最佳答案您可以通过在文
sql - 单列 SQL 上的多个计数
我目前正在运行如下查询: SELECT a.ID, a.ContactID, a.Code, FROM tableA a JOIN (SELECT ContactID, Code FROM
macos - 单列 CSV 文件是否有逗号？
当我在 excel 中打开我的 csv 文件时，它看起来像这样 - header 值 1值2值3值4值5 我想知道这个文件中是否真的有逗号？我知道如果我有多个列，我会看到逗号最佳答案您可以通过在文
mysql - 单列(带空格)名称被分成两部分
我正在使用 codeigniter insert_batch($table, $data);我的列名称为“客户发布的评论”。当我尝试批量插入数据时。插入查询更改为: INSERT INTO `tab
python - 单列 QTreeview 搜索过滤器
我有两个问题: 我想知道这是否是对单列 TreeView 进行搜索/过滤的正确方法。我觉得我的很多复制/粘贴可能包含不必要的东西。 QSortFilterProxyModel子类中的所有代码和sear
ruby - 单列 rpm 命令输出
我有一个应用程序，我想获取多个软件包的 RPM 信息，并以令人愉悦且引人注目的方式对其进行格式化。 *繁荣*。我的问题是 rpm 想要将数据格式化为两列，这很烦人。命令 rpm -qi ruby
sql-server - 单列(身份)表的用法？
具有单列表(身份列)的目的是什么？有没有好的用例可用？这真的是一个好习惯吗？最佳答案我认为人们使用它来复制 Oracle 的 SEQUENCE。基本上，他们希望他们在系统中创建的任何实体都有一个
php - 单列 PDO 上的 OR 运算符
我正在将数据库连接从 mysqli 转移到 PDO。更新时，我陷入了一个查询:在mysql中它是: $quec='designation=10 OR designation=11 OR designa
MySQL 单列 n-gram 拆分和计数
给定MySQL中的一列字符串(密码)并给定一个值N，我正在寻找一种sql方式来计算每个n-的频率gram(长度为 n 的子串)。将代码保留在 MySQL 中很重要，因为在我拥有的其他环境中，它会导致
c - 单列 gtktreeview 行为正确，但多列给出段错误
我对 GtkTreeView 有以下问题。当我尝试附加列表时出现问题。这是我创建的函数: static GtkWidget *setup_list_archive(GtkWidget **wid
hibernate - JPA/Hibernate Join 和 Fetch 单列
我是 JPA/Hibernate 的新手。假设我有这两个表: Employee (Id, Name, DeptId, ..)//DeptId 是外键。 Department (Id, DeptName
javascript - 我需要在 ui-grid 中显示一个字符串数组。单列，每行一个字符串
我正在调用的 REST API 返回一个数组，格式如下: ["a", "b", "c", "d"] 我的 ui-grid 需要在单列中显示这些数据条目，每行一个。我有: $scope.items
javascript - 当第一个 div 宽度较大时，Passy/Masonry 单列
我正在使用由 passy 创建的 Angular masonry 指令，当第一个元素的宽度几乎达到 100% 时我遇到了问题。在这种情况下，所有元素都合并在一个列中，否则我认为行为没问题。我创建了一
arrays - 如何将嵌套的 np.array 转换为 pandas dataframe 单列
我想将此嵌套数组转换为单个 pandas 数据框列，我该怎么做？有人可以帮我吗？ array([array([ nan, 16.40411828, 23.671878
java - MySQL:单列 SUM(IF(cond,a,b)) 与多列 Sum()
有一个遗留的 LAMP 应用程序，我正在将其转换为 JVM。所讨论的问题需要一个包含@250K 记录的评分表。目前，“scoreType”列表示为tinyint，其中1 = 目标，2 = 协助1，3
MySQL UNIQUE KEY 设计 : compound INT + VARCHAR key vs. 单列 VARCHAR 键
我正在考虑 MySQL 5.6 InnoDB 表的以下架构。我无法决定使用哪些键: "CREATE TABLE IF NOT EXISTS `context` (" " `text_

首页

博学

6Ren·AI

商城

python - 如何将pandas数据框的单列拆分为带有组的多列？