- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我只想要一个值列作为结果在下面的代码:
df = pd.DataFrame({'team':['a','a'],'balance':[100,3],'dpd':[0,60]})
df.pivot_table(index='team',values=['balance','dpd'],
aggfunc=lambda x: np.sum(np.where(x.dpd>=30,x.balance,0))/np.sum(x.balance))
balance dpd
team
a 0.029126 0.029126
dqratio
team
a 0.029126
最佳答案
我认为您正在寻找 groupby
和 apply
df.groupby('team').apply(lambda x: np.sum(np.where(x['dpd']>=30,x['balance'],0))/np.sum(x['balance'])).to_frame('dqratio')
dqratio
team
a 0.029126
关于pandas - 使用两列定义 aggfunc 作为 Pandas 数据透视表中的参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50244142/
我想用结合了两个函数的 aggfunc 创建一个数据透视表。这个我试过了 pivot=pd.pivot_table(data, columns='Genename', values=['Median
我正在尝试将自定义聚合函数应用于数据透视表,但不断收到 KeyError:“PayoffUPB”。这是 aggfunc 的语法问题吗,还是我需要在这里使用 lambda 函数?谢谢您的帮助。 impo
我正在使用 Pandas 从 django 查询集创建数据透视表。它工作得很好,我返回的是一个字符串,而不是聚合数学运算。 一切都很完美,直到我开始返回 html 字符串。现在发生的事情是这样的:pa
我想使用pivot_table来显示每个单元格中列的任意值。例如,给定一个像这样的 DataFrame: df = pd.DataFrame({'x': ['x1', 'x1', 'x2'],
假设我有 my_df: my_df = pd.DataFrame({'X': ['a', 'a', 'b', 'b'], 'Y1': [1, 2, 3, 4], 'Y2': [1, 2, 3, 4],
我正在尝试在 pandas 或 dask 中创建数据透视表,但当然我在 pandas 中遇到内存错误。这就是我想使用 dask 的原因,因为我想可能处理更大的文件。 在 pandas 中我这样做了:
我制作了一个包含各种列的数据透视表,并应用了 aggfunc,如 np.sum 和 first and count。我想要数据框中列的相应值的最后一个实例。有什么功能可以达到这个目的吗? 最佳答案 我
当我在我拥有的数据帧上创建数据透视表时,传递 aggfunc='mean' 按预期工作,aggfunc='count' 按预期工作,但是 aggfunc=['mean', 'count'] 结果:At
Agg函数的Pandas数据透视表字典 我正在尝试在旋转期间计算 3 个 aggregative 函数: 计数 均值 标准差 这是代码: n_page = (pd.pivot_table(Main_D
试图生成一个包含多个“值”列的数据透视表。我知道我可以使用 aggfunc 以我想要的方式聚合值,但是如果我不想对两列求和或求平均,而是想要一列的总和而另一列的平均值。那么使用 pandas 可以做到
我只想要一个值列作为结果在下面的代码: df = pd.DataFrame({'team':['a','a'],'balance':[100,3],'dpd':[0,60]}) df.pivot_ta
尝试运行此代码时,我收到错误(InvalidIndexError:重新索引仅对具有唯一值的索引对象有效),该代码从数据帧中创建了一个数据透视表: pivData = dfData.pivot_tabl
我有一个包含日期、买入和卖出值的数据框,并在该数据框上执行pivot_table获取每个有效日期的所有买入/卖出值(value)。 data = [('20170325', 'Buy', 400 ),
我注意到,当有多个 aggfunc 例如(“count”、“mean”、“sum”)时,我无法设置 margins=True。 它会抛出KeyError: 'Level None not found'
我正在处理一些数据并最终遇到这样的情况,我想剪下这样的系列: df = pd.DataFrame({'A': 10000*[1], 'B': np.random.randint(0, 1001, 10
我有一个关于教育和收入的 pandas 数据框,基本上如下所示。 import pandas as pd import numpy as np data = { 'education': ['
对于给定的列定义,当使用 aggFunc 时,headerName 以 func(string) 格式出现 - 我只希望标题显示我定义的字符串。当 AggFunc 为 null 时,此行为不存在。 c
Campaign ID Revenue Total 601 $2,690 601 $817 601 $0 649 $4,339 1090
我有一个 .csv 数据集正确导入、清理、NA 值按要求等。即(数据集大得多 - 名称可能包含相同的名称和日期) NAME SHIFT DEP1 DEP2 DEP3 DAY COLLIN
这两行代码只是传递的参数值不同。我不清楚的是,为什么在第一种情况下(“计数”)我们需要引号,而在第二种情况下(len)不需要引号。 by_weekday1 = users.pivot_table(in
我是一名优秀的程序员,十分优秀!