python - 如何扁平化 Dataframe(pandas) 的特定列？-6ren

python - 如何扁平化 Dataframe(pandas) 的特定列？

转载作者：行者123 更新时间：2023-11-28 17:01:38

26

4

我的数据库中有一个非常大的游戏记录数据集。假设一个数据框是它的一部分，代表一个游戏，例如:

+----------+------+------+-------+----------+------------+-----+----------------+
| _id_game | age  | rank | grade |   time   |   date     | ... |   _id_player   |
+----------+------+------+-------+----------+------------+-----+----------------+
| key2589  | 14.0 |  1.0 | B     | 00:02:34 | 2015/08/02 | ... | maximi-125     |
| key2589  | 28.0 |  2.0 | A     | 00:02:50 | 2015/08/02 | ... | scooby-897     |
| key2589  | 16.0 |  3.0 | B     | 00:03:21 | 2015/08/02 | ... | zorro-003      |
| key2589  | 30.0 |  4.0 | D     | 00:03:45 | 2015/08/02 | ... | barabapapa-007 |
+----------+------+------+-------+----------+------------+-----+----------------+

上面这个数据框的每一行代表这个游戏的一个玩家。我想在每一行中显示游戏中所有其他玩家的一些特征(因此每个玩家与其竞争对手相比)。

我想像这样修改数据框:

+----------+------+------+-------+----------+------------+--------+--------+--------+----------+-----+----------------+
| _id_game | age  | rank | grade |   time   |    date    | p1_age | p2_age | p3_age | p1_grade | ... |   _id_player   |
+----------+------+------+-------+----------+------------+--------+--------+--------+----------+-----+----------------+
| key2589  | 14.0 |  1.0 | B     | 00:02:34 | 2015/08/02 |   28.0 |   16.0 |   30.0 | A        | ... | maximi-125     |
| key2589  | 28.0 |  2.0 | A     | 00:02:50 | 2015/08/02 |   14.0 |   16.0 |   30.0 | B        | ... | scooby-897     |
| key2589  | 16.0 |  3.0 | B     | 00:03:21 | 2015/08/02 |   14.0 |   28.0 |   30.0 | B        | ... | zorro-003      |
| key2589  | 30.0 |  4.0 | D     | 00:03:45 | 2015/08/02 |   14.0 |   28.0 |   16.0 | B        | ... | barabapapa-007 |
+----------+------+------+-------+----------+------------+--------+--------+--------+----------+-----+----------------+

如您所见，我不会重复字段 date 或 _id_game。只是具体的领域是玩家的特点。

主要思想是对一个领域进行预测，考虑到一行代表的每个人的其他竞争对手的存在。

考虑到一个 df 只是一个游戏，我不知道如何在 pandas 数据框中做到这一点。考虑到数据框包含一堆游戏，这就更复杂了。

有人帮我吗？

最佳答案

这是一个交叉连接问题，在连接之后我们需要过滤以排除每行重复项，然后重新格式化输出

s=df[['_id_game','rank']].merge(df[['_id_game','age','rank','grade']],on='_id_game')#  merge here
s=s[s.rank_x!=s.rank_y]# filter the one already have 
s=s.assign(key=s.groupby(['_id_game','rank_x']).cumcount()+1)# ge tthe key for pivot 
s=s.set_index(['_id_game','rank_x','key'])[['age','grade']].unstack() # reformat 
s.columns=s.columns.map('P{0[1]}_{0[0]}'.format)# flatten the columns 
s
Out[850]: 
                 P1_age  P2_age  P3_age P1_grade P2_grade P3_grade
_id_game rank_x                                                   
key2589  1.0       28.0    16.0    30.0        A        B        D
         2.0       14.0    16.0    30.0        B        B        D
         3.0       14.0    28.0    30.0        B        A        D
         4.0       14.0    28.0    16.0        B        A        B

这里你只需要merge回到原始数据框检查link

关于python - 如何扁平化 Dataframe(pandas) 的特定列？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54012575/

26

4

0

文章推荐： javascript - v-for 不呈现任何值

文章推荐： jquery - Bootstrap 滑动标签(不是标签内容)

文章推荐： javascript - 单击时获取具有自己的迭代按钮的输入值

文章推荐： python - 将字符串转换为字典列表

teamcity - 扁平化 TeamCity 工件文件夹结构
我有一个 TeamCity (9.0.2) 构建配置，其中包含以下工件路径模式: App\Agent\**\bin\%env.Configuration%\** => Deployment\Agent
javascript - 扁平化 babel 输出
我在 src 目录中有一个具有嵌套文件结构的项目。到目前为止，我一直在使用 babel --out-dir lib src 。最近我想到了一个想法，让用户直接使用单独的文件，所以基本上我想改造这个结构
sql - 扁平化 SQL 中的日期间隔
我有一个数据库表，其中三列对于这个问题至关重要: 组 ID，将行分组在一起开始日期结束日期我想从此表中创建一个 View ，以便将具有相同分组 ID 的重叠日期间隔展平。不重叠的日期间隔不得展
python - 扁平化 pandas 数据框的最有效方法是什么？
我有一个很大的 pandas 数据框，有 8 列和几个 NaN 值: 0 1 2 3 4 5 6 7 8 1 Google, Inc. (Date 11/07/20
c++ - 扁平化 C++ 结构
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 5 年前。 Improve this ques
arrays - 扁平化 simd_float4x4 矩阵的优雅方式
我想将 simd_float4x4 或 simd_float3x3 矩阵展平为单个浮点元素数组。对于常规数组我会使用 let arr = [[1,2,3],[4,5,6],[7,8,9]] prin
python - 扁平化 OrderedDict 值的联合
我正在寻找一种 Pythonic 方式来获取 OrderedDict 的 .values 的并集，在折叠组成值的列表之后。我希望结果是一维列表，根据自定义顺序排序。我在做什么: from coll
加入列表的 Python 列表理解(扁平化)
这个问题在这里已经有了答案: How do I make a flat list out of a list of lists? (36 个答案) 关闭 9 年前。所以我目前正在使用 mongoe
ruby - 扁平化 Ruby 数组
我有一个像这样的数组。 [{"title"=>"ga:browser=Internet Explorer", "dimensions"=>[{:browser=>"Internet Explorer"
javascript - 扁平化 JSON 数据
我正在尝试使用 Tabulator 创建工单列表，数据通过 AJAX url 从工单系统导入为 JSON，如下所示。 { "results": [ {
java - 扁平化 Java future
我有两个函数，每个函数都返回 CompletebleFuture实例，我想 or它们变成一个有序且可短路的 future 。 public CompletableFuture doA(); publi
mysql - 扁平化 mysql 中的非主键列
我需要在 mysql 中用逗号分隔值将非主键列展平为一行。让我们举一个简单的例子。有一个名为 stud_sub 的表，其中 stud_id 和 sub_id 作为复合主键。现在我想要一个表，其中 st
python - 扁平化 python 列表的列表理解如何工作？
这个问题在这里已经有了答案: Comprehension on a nested iterables? (13 个答案) 关闭 4 个月前。我最近在寻找一种将嵌套的 Python 列表展平的方法，
C# 扁平化 json 结构
我在 C# 中有一个 json 对象(表示为 Newtonsoft.Json.Linq.JObject 对象)，我需要将它扁平化为字典。让我用一个例子来说明我的意思: { "name": "t
xml - XSLT 扁平化 XML
有人可以帮我进行以下转换吗？这里是输入的xml: My book 200 big Smith Wallace
scala - 扁平化 future 内部 yield
在下面的代码中，x 是 Future[Future[Int]] 类型，我需要将其展平为 Future[Int] .这怎么可能？ def times(a:Int, b:Int) = Future
r - 扁平化/非规范化 R 聚合函数的结果
我对 R 还很陌生，我正在尝试使用 aggregate对数据帧、每个主题和数据集中的每个指标执行一些时间序列整形。这很好用，但我发现结果不是很容易使用的格式。我希望能够将结果转换回与原始数据帧相同的格
表单字段的 Python Django PDF 扁平化
我有一个项目，我需要填写预制的 PDF，我想到的最合乎逻辑的解决方案是将预制的 PDF 制作成 PDF 表单，以便输入值应该放在标签中，然后我可以查看 PDF 中的表单标签，并将它们与值字典对齐。我
performance - WaIISHost 扁平化 Web 角色
首先，我对 Azure 还很陌生。我已使用 Web 角色成功将 ASP.NET MVC 3 Web 应用程序部署到 Azure。该应用程序使用 Entity Framework 和 SQL Azur
function - 使用 XQuery 扁平化 XML
我试图将 XML 层次结构展平为文本节点，其中输出标记名称是每个文本节点路径上的连字符连接标记。我对 http://www.chilkatsoft.com/xml-samples/bookstore.

首页

博学

6Ren·AI

商城

python - 如何扁平化 Dataframe(pandas) 的特定列？