python - 仅使用相关列取消堆叠数据框-6ren

python - 仅使用相关列取消堆叠数据框

转载作者：太空宇宙更新时间：2023-11-03 16:34:17

25

4

我有以下数据框:

data = {'year': [2010, 2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012, 2013],
            'store_number': ['1944', '1945', '1946', '1947', '1948', '1949', '1947', '1948', '1949', '1947'],
            'retailer_name': ['Walmart','Walmart', 'CRV', 'CRV', 'CRV', 'Walmart', 'Walmart', 'CRV', 'CRV', 'CRV'],
            'product': ['a', 'b', 'a', 'a', 'b', 'a', 'b', 'a', 'a', 'c'],
            'amount': [5, 5, 8, 6, 1, 5, 10, 6, 12, 11],
            'vat': [0.5, 0.5, 0.8, 0.6, 0.1, 0.5, 0.10, 0.6, 0.12, 0.11]}

    stores = pd.DataFrame(data, columns=['retailer_name', 'store_number', 'year', 'product', 'amount', 'vat'])
    stores.set_index(['retailer_name', 'store_number', 'year', 'product'], inplace=True)
    df = stores.groupby(level=[0, 1, 2, 3]).sum().unstack('product')
    mask = pd.IndexSlice['amount', :]
    df.loc[:, mask] = df.loc[:, mask].fillna(0)

我得到以下输出:

                                amount           vat           
product                              a   b   c     a    b     c
retailer_name store_number year                                
CRV           1946         2011      8   0   0  0.80  NaN   NaN
              1947         2012      6   0   0  0.60  NaN   NaN
                           2013      0   0  11   NaN  NaN  0.11
              1948         2011      6   1   0  0.60  0.1   NaN
              1949         2012     12   0   0  0.12  NaN   NaN
Walmart       1944         2010      5   0   0  0.50  NaN   NaN
              1945         2010      0   5   0   NaN  0.5   NaN
              1947         2010      0  10   0   NaN  0.1   NaN
              1949         2012      5   0   0  0.50  NaN   NaN

我的最终结果中不需要这些 vat 列，如何从我的 unstack 中删除它们？

最佳答案

对我来说有效:

df = stores.groupby(level=[0, 1, 2, 3]).sum().unstack('product')

df = df['amount'].fillna(0)
print (df)
product                             a     b     c
retailer_name store_number year                  
CRV           1946         2011   8.0   0.0   0.0
              1947         2012   6.0   0.0   0.0
                           2013   0.0   0.0  11.0
              1948         2011   6.0   1.0   0.0
              1949         2012  12.0   0.0   0.0
Walmart       1944         2010   5.0   0.0   0.0
              1945         2010   0.0   5.0   0.0
              1947         2010   0.0  10.0   0.0
              1949         2012   5.0   0.0   0.0

一起:

df = stores.groupby(level=[0, 1, 2, 3]).sum().unstack('product')['amount'].fillna(0)
print (df)

product                             a     b     c
retailer_name store_number year                  
CRV           1946         2011   8.0   0.0   0.0
              1947         2012   6.0   0.0   0.0
                           2013   0.0   0.0  11.0
              1948         2011   6.0   1.0   0.0
              1949         2012  12.0   0.0   0.0
Walmart       1944         2010   5.0   0.0   0.0
              1945         2010   0.0   5.0   0.0
              1947         2010   0.0  10.0   0.0
              1949         2012   5.0   0.0   0.0

另一个解决方案是选择 sum 的 amount 列:

df = stores.groupby(level=[0, 1, 2, 3])['amount'].sum().unstack('product').fillna(0)
print (df)
product                             a     b     c
retailer_name store_number year                  
CRV           1946         2011   8.0   0.0   0.0
              1947         2012   6.0   0.0   0.0
                           2013   0.0   0.0  11.0
              1948         2011   6.0   1.0   0.0
              1949         2012  12.0   0.0   0.0
Walmart       1944         2010   5.0   0.0   0.0
              1945         2010   0.0   5.0   0.0
              1947         2010   0.0  10.0   0.0
              1949         2012   5.0   0.0   0.0

关于python - 仅使用相关列取消堆叠数据框，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37342414/

25

4

0

文章推荐： python - PyMongo 与 Django 和 uwsgi

文章推荐： forms - 将捐赠表格中的结转金额转移到 PayPal

ios - UICollectionView 堆叠
如何将单元格(在 UICollectionView 中)堆叠在一起？ Feedly 做得很好，我想知道是否可以以某种方式操纵 zIndex 属性以在 UICollectionView 的导航中获得类似
css 堆叠 div
我正在尝试堆叠 div 以使用和图像显示顶部和底部淡入淡出。外部 div(“旋转器”)有一个背景图像，该图像在顶部和底部具有渐变，在中间是透明的。在中间，我想显示内容或图像，并将外部 div 背景图
CSS 堆叠 Div
我有两个动画(在 CSS 中)div，它们围绕彼此旋转。我想在中间为文本添加另一个 div。但是，如果我将 div 放在这两个中的任何一个中，它就会与父 div 一起设置动画。如果我尝试定位它，它就位
Android 堆叠 View
图中显示了我想要的 View 。最佳答案为此你可以采取 FrameLayout . 例如 - 1: 更新: 例如 - 2:精湛的示例和技巧，可在此处找到:http://w
tensorflow - 堆叠 LSTM 的初始状态结构
使用 tf.keras.layers.RNN 的 TensorFlow (1.13.1) 中多层/堆叠 RNN 的初始状态所需的结构是什么？ API？我尝试了以下方法: lstm_cell_size
r - ggplot2 - 堆叠/躲避条形图
我在制作条形图时遇到问题，其中 y 轴不是计数，而是变量的值。我使用stat=identity，这对于一个变量来说很好。但是，如果我有两个变量并且想要创建堆叠/闪避条形图怎么办？我这里有一些模拟数
r - 对路径列表中的栅格进行分组/堆叠，并提取每组的最小值
我有一个栅格路径列表(rplist = 912 raster pathe for 912 rasters (19yeras)(12months)(4weeks))如下: [1] "C:/Users
php - 堆叠 PHP 代码？
我已经完成了一个项目，现在需要更改该项目，以便在变量位于数组中时显示一个 div，如果变量不在数组中则显示另一个 div。通常我会这么做祝你愉快，但是我得到的代码已经包含大量 html 和 ph
r - ggplot2 - 堆叠/躲避条形图
我在制作条形图时遇到问题，其中 y 轴不是计数，而是来自变量的值。我使用 stat=identity，这对一个变量来说没问题。但是，如果我有两个变量并想创建一个堆叠/闪避条形图怎么办？我这里有一些
r - 对路径列表中的栅格进行分组/堆叠，并提取每组的最小值
我有一个栅格路径列表(rplist = 912 raster pathe for 912 rasters (19yeras)(12months)(4weeks))如下: [1] "C:/Users
java - 标签重叠(堆叠)有问题
我正在尝试将分数和耗时标签(scoreAndTimer)添加到我已经工作的贪吃蛇游戏代码中。问题是当我使用 ScoreAndTimer.setText(); 时它与之前的文本堆叠在一起。我尝试 se
gtk - 堆叠 GTK+ 小部件
有没有办法将 GTK+ 小部件放入堆栈中？ IE。在标签上放置一个按钮，使按钮覆盖标签的一部分。最佳答案您可以使用 GtkFixed 作为布局。这将允许您控制子小部件的确切位置，并且它们可以重叠。
java - 堆叠 ASM 访问者的正确方法是什么？
我有以下代码: for (Map.Entry e : classes.entrySet()) { ClassReader reader = e.getValue(); ClassWri
r - 根据ggplot2中类别的比例调整(堆叠)条宽
我正在尝试根据类别的计数(或比例)更改我的(堆叠)条宽，作为示例，我使用了钻石数据集。我想根据每个类别(变量 cut )的频率看到不同的宽度。我首先创建了一个变量 cut_prop然后用下面的代码绘制
c# - DispatcherTimer 堆叠 - UWP
我目前正在 UWP 中开展一个项目，我有一个 CommandBar，我想将其从 Hidden 变为 Compact 如果鼠标移动。五秒钟后(如果鼠标不移动)CommandBar 应该再次返回到Hidd
ios - 动画期间 subview 堆叠
我是 Swift 新手，并尝试在学习过程中编写一本交互式书籍。我使用 CATransform3DMakeRotation 创建了封面效果。正如您所看到的，当我堆叠 View 时，问题就出现了。如果我
android - 使用相机快照防止多项 Activity 堆叠
我已经阅读了 finish(); 命令和 FLAG_ACTIVITY_CLEAR_TOP 命令，还查看了 Common Ware 关于终止应用程序的回答，但我不确定如何放置这进入我的应用程序。基本上
c++ - 堆叠 Cg 着色器
在我的引擎中，我从成对的顶点/像素着色器文件中加载 Cg 着色器。我希望能够堆叠着色器以组合它们(照明+ Material 等)。除了将着色器分解为单独的函数然后从中创建单个着色器脚本字符串之外，您是
java - 相同的 Activity 堆叠
我有一个 Activity 应该自行完成并关闭应用程序。现在，在某些情况下，根据用户导航到 Activity 的方式而变化， Activity 正在堆叠。当 Activity 堆积时，然后调用 fin
python - 堆叠 CSV 文件的最快方法
我有 10 个具有完全相同的列和数据类型的 csv 文件。什么是最快/最有效的堆叠方式？ CSV1: col1 | col2 | col3 1 | 'a' | 0.1 2 | 'b'

首页

博学

6Ren·AI

商城

python - 仅使用相关列取消堆叠数据框