gpt4 book ai didi

python - 在回归中使用 group by 定义 python 中的 x 和 y 值

转载 作者:行者123 更新时间:2023-12-01 08:17:47 25 4
gpt4 key购买 nike

是否可以对数据进行分组(用于定义 x 和 y 变量)以便直接在 regPlot(或任何其他 seaborn 功能)中运行回归?我找不到此类内置功能。<​​/p>

例如,在一列中,我有一个分类变量“C”,然后我尝试使用 C 的每个类别的中位数来拟合回归线(包含 x 和 y)。是否有任何功能可以这样做?

最佳答案

您需要先使用 pandas 对数据进行分组,然后使用 seaborn 进行绘图。由于您没有提供数据框,我将使用 seaborn 示例数据集进行演示。

import pandas as pd
import seaborn as sns
# load dataframe
df = sns.load_dataset('car_crashes')

数据框如下所示。 abbrev 列是类别列。我将使用 totalspeeding 变量作为 y 和 x。

enter image description here

首先,使用 pandas .groupby() 方法并传递您的分类变量,同时链接另一个方法 .median() 以便 pandas 聚合您的数据并返回数据的中位数。 Pandas 将返回一个如下所示的数据框 enter image description here

然后只需调用您要绘制的列即可。在我们的例子中,它们是总计超速。之后,将 x 和 y 传递给seaborn .regplot()

# group by
x = df.groupby(['abbrev']).median().speeding
y = df.groupby(['abbrev']).median().total
# plot
sns.regplot(x, y)

enter image description here

关于python - 在回归中使用 group by 定义 python 中的 x 和 y 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54883814/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com