python - 将函数应用于 groupby 函数-6ren

python - 将函数应用于 groupby 函数

转载作者：太空宇宙更新时间：2023-11-04 10:41:48

24

4

我想在 groupby 上计算有多少一致增加，以及第一个元素和最后一个元素之间的差异。但我无法在 groupby 上应用该功能。 groupby之后是list吗？还有“apply”和“agg”之间的区别是什么？不好意思，刚接触python几天。

def promotion(ls):
    pro =0
    if len(ls)>1:
        for j in range(1,len(ls)):
            if ls[j]>ls[j-1]:
                pro + = 1
    return pro
def growth(ls):
    head= ls[0]
    tail= ls[len(ls)-1]
    gro= tail-head
    return gro
titlePromotion= JobData.groupby("candidate_id")["TitleLevel"].apply(promotion)
titleGrowth= JobData.groupby("candidate_id")["TitleLevel"].apply(growth)

数据是:

candidate_id    TitleLevel     othercols
1                 2              foo
2                 1              bar
2                 2              goo
2                 1              gar
The result should be
titlePromotion
candidate_id 
1                  0
2                  1
titleGrowth
candidate_id
1               0
2               0

最佳答案

import pandas as pd

def promotion(ls):
    return (ls.diff() > 0).sum()

def growth(ls):
    return ls.iloc[-1] - ls.iloc[0]

jobData = pd.DataFrame(
    {'candidate_id': [1, 2, 2, 2],
     'TitleLevel': [2, 1, 2, 1]})

grouped = jobData.groupby("candidate_id")
titlePromotion = grouped["TitleLevel"].agg(promotion)
print(titlePromotion)
# candidate_id
# 1               0
# 2               1
# dtype: int64

titleGrowth = grouped["TitleLevel"].agg(growth)
print(titleGrowth)
# candidate_id
# 1               0
# 2               0
# dtype: int64

一些提示:

如果定义泛型函数

def foo(ls):
    print(type(ls))

并调用

jobData.groupby("candidate_id")["TitleLevel"].apply(foo)

Python 将打印

<class 'pandas.core.series.Series'>

这是发现调用 jobData.groupby(...)[...].apply(foo) 传递 Series 到 foo。

apply 方法为每个组调用一次 foo。它可以返回一个 Series 或 DataFrame，并将结果 block 粘合在一起。当 foo 返回一个对象，例如数值或字符串时，可以使用 apply，但在这种情况下，我认为使用 agg 是首选.使用 apply 的一个典型用例是当您想要对一组中的每个值进行平方运算并因此需要返回一个具有相同形状的新组时。

transform 方法在这种情况下也很有用——当您想要转换组中的每个值并因此需要返回相同形状的东西时——但结果可能与 apply 不同，因为不同的对象可能会传递给 foo (例如，分组数据帧的每一列都将传递给 foo 当使用 transform 时，整个组将被传递给 foo 当使用 apply 时。最简单的理解方式是试验一个简单的数据框和通用的 foo。)

agg 方法为每个组调用一次 foo，但与 apply 不同的是，它应该为每个组返回一个数字。该组被聚合成一个值。使用 agg 的典型用例是当您想要计算组中项目的数量时。

您可以使用通用的 foo 函数调试并了解原始代码出了什么问题:

In [30]: grouped['TitleLevel'].apply(foo)
0    2
Name: 1, dtype: int64
--------------------------------------------------------------------------------
1    1
2    2
3    1
Name: 2, dtype: int64
--------------------------------------------------------------------------------
Out[30]: 
candidate_id
1               None
2               None
dtype: object

这显示了传递给 foo 的系列。请注意，在第二个系列中，索引值为 1 和 2。因此 ls[0] 引发了一个 KeyError，因为没有值为 0< 的标签 在第二个系列中。

您真正想要的是系列中的第一项。这就是 iloc 的用途。

总结一下，使用 ls[label] 选择索引值为 label 的 Series 行。使用 ls.iloc[n] 选择系列的第 n 行。

因此，要以最少的更改修复您的代码，您可以使用

def promotion(ls):
    pro =0
    if len(ls)>1:
        for j in range(1,len(ls)):
            if ls.iloc[j]>ls.iloc[j-1]:
                pro += 1
    return pro
def growth(ls):
    head= ls.iloc[0]
    tail= ls.iloc[len(ls)-1]
    gro= tail-head
    return gro

关于python - 将函数应用于 groupby 函数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20153307/

24

4

0

文章推荐： java - 在 Spark Streaming 中将 StreamingContext 与 Receiver 分开

文章推荐： jquery - Bootstrap Navbar 折叠按钮在点击时不起作用

文章推荐： linux - 在nodejs中使用子进程创建密码保护的zip文件

r - 应用于 3 个变量的数据框转换
我写了几个命令来转换数据框，但我想将我写的代码简化为四个部分。第 1,2 和 3 部分用于计算第 1、2 和 3 列(计算每列重复值的次数，并完成 0 和三列最大值之间的缺失数)。第四部分是加入前面的
scala - 应用于 Scala 函数的类型参数
我试图理解应用于函数的类型参数。我想在下面的方法中使用通用类型，但为了我的理解使用 String 和 Int。当我如下定义一个函数时 def myfunc[Int](f:String => I
应用于 DIV 内容的 CSS
我有一个像下面这样的 DIV: // link to some js .js 在 div 中呈现最新的文章摘要。然而，它在 Calibri
gridview - 应用于 gridview 中的边界字段的格式不起作用
我在 GridView 中有以下列，一列是日期，另一列是美元金额。我应用了格式并将 HtmlEncode 属性设置为 false，但值仍然未格式化: 这就是这些值在 GridView 中的显示方式
haskell - 应用于 Haskell 中标记类型的通用函数
假设我已经定义了这些类型: data Km = Km Float deriving (Show, Eq) data Mile = Mile Float deriving (Show, Eq
haskell - 关于上下文中的值(应用于 Monad)
我有一个关于 value in context 的小问题。取 Just 'a'，所以在这种情况下 Maybe 类型上下文中的值是 'a' 采用[3]，因此在这种情况下，[a] 类型上下文中的值为3
rollapply 应用于 xts 对象
require(quantmod) require(PerformanceAnalytics) getSymbols('INTC') x<- monthlyReturn(INTC) rollapply
vba - 应用于 Word 修订版的更改使两个段落合二为一
我正在使用 VBA 对“已应用字轨更改”文档进行更改。红色段落结束标记是插入段落结束标记。(打开“跟踪更改”> 将光标放在第一段末尾 > 按 Enter > 插入新段落内容 > 格式风格不同) 我需
c++ - 应用于 const 和非常量对象的引用返回方法
考虑以下代码: class A{ my_method(const B& b){ import_something_from_c(this, b.getC()); // does some
ios - 应用于 Material 时像素化图像纹理
我正在为自定义 Material 分配图像。分配的图像看起来有点像素化，类似于此图像我已经将抗锯齿设置为 4 倍。我该如何解决这个问题？最佳答案尝试将 Material 的 mipFilter
css - 应用于 HTML 元素的样式总是被覆盖
我将样式应用于元素和元素。是否可以在上使用样式元素应用于似乎不遵循 CSS 特异性的通常规则。这是真的吗？示例:http://jsfiddle.net/59dpy/ 尝试将所有背景色设为红
html - 应用于 TD 时垂直虚线边框不均匀
有没有办法将垂直虚线边框应用于没有他们(边界)合并？我说的是附图上的东西——有 3 个这里的元素，每个元素包含 2 的。如果我申请 border-right: 1px dashed black到
html - 应用于 body 时线性渐变不起作用
当我在 CSS 中对主体应用线性渐变时，如下所示 body { background: linear-gradient(#10416b, black); } 它不会将它应用到整个网页，而是将它应用到页
css - 应用于 td 的边界半径没有内半径
当我将边框和边框半径应用于 td 时，内半径是一个直 Angular ，根本不是圆的。最佳答案问题很可能是背景不透明的子元素会剪掉边框的内半径。要解决此问题，您可以在 td 上应用 overfl
CSS 应用于 SVG 组元素但不在使用时
基本上，我有一个小的 SVG，它使用一个组来定义一个可重用的符号。该组包括我想在 CSS 中设置动画的路径。我面临的问题是只有“原始”元素应用了 CSS，“使用过”的元素没有。 .player_arr
html - 应用于 td 的宽度属性
宽度属性在这里不起作用: td { height: 50px; width: 25px; border: 1px
Java:应用于 Map 泛型类型的多态性
我想要一个函数(例如)在两种情况下输出 Map 的所有值: Map map1 = new HashMap(); Map map2 = new HashMap(); output(map1, "1234
java - 应用于 AlertDialog 的样式无法正常工作
我被要求将我们应用中的警报对话框的外观与应用主题使用的外观相匹配。我设法将样式应用于应用程序中的所有警报对话框，并将其用作应用程序主题的一部分，但有些情况下样式应用不正确。例如，当警报对话框包含“
ios - 应用于 CGPath 的比例变换会影响渲染质量吗？
我有一个 CGPath(由 UIBezierPath 创建)，我想通过应用 CGAffineTransformScale 将其缩放到我想要的任何大小。这会影响我的绘图质量(在转换为图像时)吗？如果不
c++:应用于 vector 的STL算法也适用于其他容器对象吗？
您好，我已经在 vector 上使用了一些 STL 算法，例如 find_if、count_if、sort、push_back 等。现在我想为所有容器对象( vector 、列表、映射、集合)制作一个

首页

博学

6Ren·AI

商城

python - 将函数应用于 groupby 函数