python - 在pivot_table pandas之后丢失值-6ren

python - 在pivot_table pandas之后丢失值

转载作者：行者123 更新时间：2023-12-01 00:09:42

31

4

我有以下数据框:

df.between_time('09:00', '09:05').head(10)

                     Qtd   Preço  Núm            CC           CV        Agr
Hora                                                                       
2020-01-19 09:05:00    5  4073.5  734    1618-Ideal    308-Clear   Vendedor
2020-01-19 09:05:00    5  4073.5  733    1618-Ideal   120-Genial   Vendedor
2020-01-19 09:05:00    5  4073.5  732    120-Genial   1618-Ideal   Vendedor
2020-01-19 09:05:00   10  4074.0  731  045-C Suisse  127-Tullett   Vendedor
2020-01-19 09:05:00    5  4074.0  730    120-Genial  127-Tullett   Vendedor
2020-01-19 09:05:00    5  4074.0  729  072-Bradesco  127-Tullett   Vendedor
2020-01-19 09:05:00    5  4074.0  728       008-UBS       003-XP   Vendedor
2020-01-19 09:04:59   20  4074.5  727     262-Mirae      122-BGC  Comprador
2020-01-19 09:04:59    5  4074.5  726  072-Bradesco      122-BGC   Vendedor
2020-01-19 09:04:59   35  4074.5  725       008-UBS      122-BGC   Vendedor

尝试旋转表时，值从 int 更改为 float 并且结果值与实现的值不匹配:

df.between_time('09:00', '09:05').head(10).pivot_table(index = 'Preço', columns = 'Agr', values = 'Qtd')

Agr     Comprador  Vendedor
Preço                      
4073.5        NaN      5.00
4074.0        NaN      6.25
4074.5       20.0     20.00

卖家列收到一个不可能的值 (6.25)，因为在第一个数据帧中只有整数值。

如何解决这个问题，以便列收到列 Qty 的正确总和？

最佳答案

DataFrame.pivot_table 中的默认聚合函数是 np.mean ，所以有必要添加 aggfunc='sum' :

df1 = (df.between_time('09:00', '09:05')
         .head(10)
         .pivot_table(index = 'Preço', columns = 'Agr', values = 'Qtd', aggfunc='sum'))

详情 :

print (df.pivot_table(index = u'Preco', columns = 'Agr', values = 'Qtd', aggfunc='sum'))
Agr     Comprador  Vendedor
Preço                      
4073.5        NaN      15.0
4074.0        NaN      25.0
4074.5       20.0      40.0

关于python - 在pivot_table pandas之后丢失值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59811530/

31

4

0

文章推荐：当字符串从服务器返回时，jQuery 表单插件的文件上传问题

文章推荐： sql - 每月重置的运行总计

python - Pandas :pivot 和 pivot_table 之间的区别。为什么只有 pivot_table 工作？
我有以下数据框。 df.head(30) struct_id resNum score_type_name score_value 0 4294967297 1
Python pivot_table - 添加差异列
我是python的新手。我有以下数据框。我能够在 Excel 中旋转。我想添加差异列(在图像中，我手动添加了它)。区别在于B-A值。我能够使用 Python 数据透视表复制差异列和总计。下面是我的
dataframe - 如何使用Dask Pivot_table？
我正在尝试在 Dask 上使用 Pivot_table 和以下数据框: date store_nbr item_nbr unit_sales year month 0
python - Pivot_table 来自列值中的列表
我有一个像这样的数据框: ID Sim Items 1 0.345 [7,7] 2
python - pivot_table 没有要聚合的数字类型
我想根据以下数据框制作一个数据透视表，其中包含列 sales、rep。数据透视表显示 sales 但没有 rep。当我尝试仅使用 rep 时，出现错误 DataError: No numeric ty
pandas pivot_table() 按日期分多列数据的方法
如下所示： date 20170307 20170308 iphone4 2 0
python - pandas pivot_table 的边距仅垂直聚合
考虑一个数据框: df = pd.DataFrame( {'last_year': [1, 2, 3], 'next_year': [4, 5, 6]}, index=['foo',
python - 操作 pivot_table 中的多索引列
我看到这个问题被问过多次，但其他问题的解决方案没有奏效! 我有这样的数据框 df = pd.DataFrame({ "date": ["20180920"] * 3 + ["20180921"] *
python - Pandas pivot_table 的更快替代品
我正在使用 Pandas pivot_table在大型数据集(1000 万行，6 列)上运行。由于执行时间是最重要的，我尝试加快进程。目前处理整个数据集需要大约 8 秒，这很慢，我希望找到提高速度/性
python - Pandas pivot_table 因列和边距而失败
我收到了 KeyError: "... not in index"使用pandas的pivot_table时。这是示例代码: arrays = [['bar', 'bar', 'foo', 'foo
python - 带有pd.grouper和Margins的Pivos Pivot_table
当将列设置为Margins=True时，pd.grouper datetime在 Pandas 数据透视表中将不起作用。这是我的代码，可以按预期工作- p = df.pivot_table(value
python - Pandas pivot_table 保留顺序
>>> df A B C D 0 foo one small 1 1 foo one large 2 2 foo one large 2 3 foo two sm
python - Pandas pivot_table 包含空身份
数据集 x y a 1 3 0 1 1 0 1 2 0 3 6 0 5 3 1 1 5 0 1 7 0 1 6 0 1 4
python - Pandas pivot_table 包含空身份
数据集 x y a 1 3 0 1 1 0 1 2 0 3 6 0 5 3 1 1 5 0 1 7 0 1 6 0 1 4
python - 使用 pivot_table 时应用不同的聚合函数
我有这个样本: import pandas as pd import numpy as np dic = {'name': ['j','c','q','j','c','q','j','c
python - Pandas pivot_table 不符合值顺序
我对 pandas pivot_table 有疑问。有时，“值”列表中指定的列的顺序不匹配 In [11]: p = pivot_table(df, values=["x","y"], cols=[
python - Pandas pivot_table 百分位数
我试图通过平均值、中位数、第 25 个百分位数、第 75 个百分位数、标准差来描述 A 列、B 列。 df = pd.DataFrame({'A':[1,9,3,4,6,8,2,7],
python pandas pivot_table 列一级错误名称
我有下表: ID Metric Level Level(% Change) Level(Diff) Index 0 2016 A 10
python - Pivot_table MultiIndex 到列
我有下表: In [303]: table.head() Out[303]: people weekday weekofyear 2012-01-01 119
python - 将总列的百分比添加到 Pandas pivot_table
我似乎无法弄清楚如何将每个 date_submitted 组的总列百分比添加到下面的 pandas 数据透视表中: In [177]: pass_rate_pivot date_submitted

首页

博学

6Ren·AI

商城

python - 在pivot_table pandas之后丢失值