python - Pandas groupby 具有自定义函数以数组形式返回列值-6ren

python - Pandas groupby 具有自定义函数以数组形式返回列值

转载作者：行者123 更新时间：2023-12-02 02:55:02

24

4

我一定做错了什么，但即使经过重大试验，我也无法弄清楚我做错了什么......

数据:

df = pd.DataFrame({
    'ID': [3,3,3,2,2,2,1,1],
    'X': [10,11,12,20,21,30,31,32],
    'Y': [100,110,120,200,210,300,310,320]
})

# Outputs:
   ID   X    Y
0   3  10  100
1   3  11  110
2   3  12  120
3   2  20  200
4   2  21  210
5   2  30  300
6   1  31  310
7   1  32  320

这是我的聚合函数。 (逗号分隔值工作正常)

def _colum_to_array(data):
    # data['Xs'] = ",".join(str(d) for d in data['X']) # works
    # data['Ys'] = ",".join(str(d) for d in data['Y']) # works

    # Next two lines causes this: Length of values does not match length of index
    # which kind of make sense.
    # data['Xs'] = [data['X'].values] 
    # data['Ys'] = [data['Y'].values] 

    # but why is this not working
    # np.tile is generating same number of array data
    data['Xs'] = np.tile([data['X'].values], (data.shape[0], 1))
    data['Ys'] = np.tile([data['Y'].values], (data.shape[0], 1))

    return data

这就是我的分组方式:

df = df.groupby(['ID']).apply(_colum_to_array)

## Output is:
   ID   X    Y  Xs  Ys
0   3  10  100  10  10
1   3  11  110  10  10
2   3  12  120  10  10
3   2  20  200  20  20
4   2  21  210  20  20
5   2  30  300  20  20
6   1  31  310  31  31
7   1  32  320  31  31

我期待或试图得到的是这样的东西。 X/Y 列的值被捕获为数组

   ID   X    Y  Xs          Ys
0   3  10  100  [10,11,12]  [100,110,120]
1   3  11  110  [10,11,12]  [100,110,120]
2   3  12  120  [10,11,12]  [100,110,120]
3   2  20  200  [20,21,30]  [200,210,300]
4   2  21  210  [20,21,30]  [200,210,300]
5   2  30  300  [20,21,30]  [200,210,300]
6   1  31  310  [31,32]     [310,320]
7   1  32  320  [31,32]     [310,320]

最佳答案

使用groupby.agg与 merge如:

df_new = df.merge(df.groupby("ID", as_index=False).agg(list)\
           .rename(columns={'X':'Xs','Y':'Ys'}))
#or with pandas 1.0.1 you can do
df_new = df.merge(df.groupby("ID").agg(Xs=('X',list), Ys=('Y',list)).reset_index())

print(df_new)
   ID   X    Y            Xs               Ys
0   3  10  100  [10, 11, 12]  [100, 110, 120]
1   3  11  110  [10, 11, 12]  [100, 110, 120]
2   3  12  120  [10, 11, 12]  [100, 110, 120]
3   2  20  200  [20, 21, 30]  [200, 210, 300]
4   2  21  210  [20, 21, 30]  [200, 210, 300]
5   2  30  300  [20, 21, 30]  [200, 210, 300]
6   1  31  310      [31, 32]       [310, 320]
7   1  32  320      [31, 32]       [310, 320]

关于python - Pandas groupby 具有自定义函数以数组形式返回列值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61299310/

24

4

0

文章推荐： antd - ant design 是否有类似于 material-ui 的类似断点检查？

文章推荐： python - 如何在 Moderngl EGL 后端启用抗锯齿？

文章推荐： php - 无法在模型对象 Laravel 上调用 SAVE 方法

python 形式
这是一个新手理论问题 - 我刚刚开始使用 Python 并研究 Django 和 orm。问题:如果我开发我的对象并通过额外的开发修改基础对象结构、继承等 - Django 的 ORM 解决方案会自动
Javascript 形式 - 根据选择不同的电子邮件
我正在使用带有服务器端处理器的 JavaScript 表单，并且我希望能够让表单根据下拉列表转到不同的电子邮件。我已经根据其他表格尽了最大努力，但似乎无法通过电子邮件。我已在电子邮件地址的选项标签下添
Haskell Monadic 形式
一个简单的问题:给定定义，(来自 Haskell SOE) do x — el; el\ ...; en => el »= \x — do e2\ ...; en 和: do let d
Angular react 形式
我是 Angular 5 的新手。我目前正在研究 Angular Reactive 表单。我有一个下面的 JSON 结构，我需要在从 FORM 获取值后发回 REST API。 JSON 结构: {
Angular react 形式
我是 Angular 5 的新手。我目前正在研究 Angular Reactive 表单。我有一个下面的 JSON 结构，我需要在从 FORM 获取值后发回 REST API。 JSON 结构: {
Haskell - 形式 A -> A -> ... -> A 的所有函数
我有一个类型(称之为 A)，我想创建一个 A -> A、A -> A -> A、A -> A -> A -> ... 等类型的函数的类型类.这不起作用: {-# LANGUAGE FlexibleIn
Java线程正在重复 Swing 形式
我正在使用 java 线程同时管理多个 (3) 程序。1 用于 Java swing 表单(绘制 UI 以进行输入)，1 用于在系统托盘上设置图标(从 UI 获取输入后立即启动)，1 用于处理输入并将
css - 形式:垂直居中
在当前的元素中，我在表单中遇到了一个问题。表单中标签的字体大小可能大于默认值。如果我把它举起来，那么右边的输入必须垂直居中。我查看了 Bootstrap 和 Foundation，但都没有解决这个问
html - 组元素？形式
为了好玩，我使用了一段从 friend 那里得到的代码，并尝试创建一个包含用户名和密码的登录字段，但我很难获得单词旁边的字段。 username 这个词和你输入的框之间有很大的差距。密码也是如此。这
Angular 形式 - 访问模板中的嵌套控件
我的表单中有一个嵌套的控制组，我想访问它们的表单状态值(如原始和有效)以动态显示验证错误。是这样动态构建的 controlMap['password'] = this.password; contr
Angular 重置 react 形式
发送后我试图重置我的表单，但只有值设置为空。 component.html {{note.value?.length || 0}}/10
php - 将输入添加到 Stripe 形式
我正在尝试自定义 Stripe 结帐表单，但我不知道如何添加输入。我想添加“电话号码”和“姓名”以创建费用和客户。你知道我该怎么做吗？这是我应该自定义的代码。最佳答案您将无法使用
html - 带表格的 Angular 形式
所以我有这个需求，我想以表格的形式提交一个由五个记录组成的表单。这就是它的样子表: 这是对应的代码: Section Q.No Question
Angular react 形式 - 在模糊时验证但在键入时更新模型
我有一个使用 react 形式和输入文本的情况。我需要: 当用户输入时，根据输入的内容建议一个列表(我使用的是 ngx bootstrap typeahead)；仅当用户失去输入焦点时才验证输入字
Angular 强类型 react 形式
我希望重构我的 Angular 项目中的大量组件，以具有强类型的 FormGroups、FormArrays 和 FormControls。我只是在寻找一种实现强类型 react 形式的好方法。任何
php - 如何更改错误类(yii2 形式)
我有事件表格: 'horizontal', 'fieldConfig' => [ 'template' => "{input}\n{hint}\n{error}",
angular - 在新选项选择错误时使用多项选择的 react 形式
是否有关于如何实现多选和响应式表单的示例？我正在尝试在 multiselect-dropdown 上设置所选项目(从数据库中检索)，它会更新显示的项目( View )，但会引发以下错误: core.
javascript - 按钮打破 react 形式
我想在表单中添加按钮以动态添加输入。但是我发现，如果我在表单中添加了一个仅记录到控制台的按钮(并且当我尝试添加输入时)，它将记录日志，然后表单中断。我的Electron应用程序的前端窗口崩溃(不退出但
javascript - 具有隔离范围的指令内的 Angular 形式
我有一个这样的表格此表单位于指令内: angular.module('crowdcoreApp').directive('investorForm',function(){
javascript - 对话框中的 Angular 形式
我在 angularjs Controller 中调用的 $mdDialog 中有一个表单，如下所示: actions-controller.js function callForm() {

首页

博学

6Ren·AI

商城

python - Pandas groupby 具有自定义函数以数组形式返回列值