python - Pandas 尽可能压平行-6ren

python - Pandas 尽可能压平行

转载作者：太空宇宙更新时间：2023-11-04 04:22:46

25

4

我有一个数据框，它根据每个 ID 的信息量为某些 ID 输出多行，我想尽可能地展平它。下面是我的数据框示例。

id       address         city       state  country  company  title   email
001      80 Fake St.     San F.     CA     USA      null     null    personal@gmail.com
001      null            null       null   null     Amazon   CEO     null                              
002      2 Test Ave.     San F.     CA     USA      null     null    test@aol.com
002      null            null       null   null     Google   CEO     googleceo@gmail.com

我希望将 001 的行合并为一个，因为所有值都可以放在同一行中。对于 002，将它们放在不同的行中是可以的，因为无论如何都需要两行来存储两封电子邮件。

我试过了

df.groupby('id', squeeze=True)

这让我接近我想要的，但对于 002，它复制了第一行的所有数据并将其放在第二行。我更希望那些保持为空，这样一旦我收到最终输出，相同的数据就不会被处理两次。所以我想要的最终输出是:

id       address         city       state  country  company  title   email
001      80 Fake St.     San F.     CA     USA      Amazon   CEO    personal@gmail.com           
002      2 Test Ave.     San F.     CA     USA      null     null    test@aol.com
002      null            null       null   null     Google   CEO     googleceo@gmail.com

我永远不知道哪些列可以合并/展平，所以我不能删除基于某些列的重复项(我不认为)。关于如何实现此输出的任何建议都会很棒!

最佳答案

我在这里使用 sorted ，因为它更容易阅读

yourdf=df.groupby('id').apply(lambda x : x.apply(lambda y: sorted(y,key=pd.isnull))).dropna(thresh=2) 
yourdf
   id    address   city state country company title                email
0   1  80FakeSt.  SanF.    CA     USA  Amazon   CEO   personal@gmail.com
2   2  2TestAve.   SaF.    CA     USA  Google   CEO         test@aol.com
3   2        NaN    NaN   NaN     NaN     NaN   NaN  googleceo@gmail.com

如果你需要速度，检查justify

关于python - Pandas 尽可能压平行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54139102/

25

4

0

文章推荐： linux - Supervisord 中的命令失败 'stdout_log and system command'

文章推荐： c - 缓冲区溢出改变返回地址 C - 没有 main

文章推荐： php - 如何在 PHP 脚本中将音轨混合在一起？

list - KDB:如何从列表中做出(尽可能)均匀分布的选择？
我知道在 KDB 中，如果您有一个列表，例如... l:`apples`oranges`pears` 您可以像下面这样进行 N 次随机选择: 9?l 但是如何尽可能均匀地选择列表中的每个项目？最佳答
javascript - 在 IE 中模拟 webkit(尽可能)
我真的厌倦了它。我有一个高级 Web 应用程序依赖于大量 Javascript 库(jQuery、jQueryUI、OpenLayers、highcharts、EJSChart 等等)。不用说，Int

首页

博学

6Ren·AI

商城

python - Pandas 尽可能压平行