gpt4 book ai didi

python - Pandas dataframe.corr() 从输入中剥离列

转载 作者:行者123 更新时间:2023-12-01 07:56:34 24 4
gpt4 key购买 nike

我正在学习如何在 python3 中使用 pandas 库,并且遇到了 dataframe.corr() 的问题

这是我的数据集的示例

Date,Gender,Age at Booking,Current Age
2015-12-23,M,21,22
2015-12-23,M,25,25
2015-12-23,M,37,37
2015-12-23,F,39,40
2015-12-23,M,24,24

这是我尝试加载/转换它的方法

crime_data = pd.read_csv(crime_data_s)
print(crime_data.head())
print(crime_data['Date'])
correlated_data = crime_data.corr()
print(correlated_data)

打印犯罪数据头显示 4 列以及一些关联数据,访问“日期”列并打印其值正如预期的那样,但是当调用 crime_data.corr() 并打印数据时它删除了除“预订时年龄”和“当前年龄”之外的所有其他项目,因此使其形状为 2x2。

调用 dataframe.info() 方法,我可以看到日期和性别列被标记为对象而不是相关数据,可以采取哪些措施来解决此问题,以便我可以尝试运行数据之间的相关性?

最佳答案

data['Gender']=data['Gender'].astype('category').cat.codes
data['Date']=data['Date'].astype('category').cat.codes
data.corr()

输出

       Date  Gender    Age        curage
Date NaN NaN NaN NaN
Gender NaN 1.000000 0.162804 -0.703474
Age NaN -0.162804 1.000000 0.814425
curage NaN -0.703474 0.814425 1.000000

关于python - Pandas dataframe.corr() 从输入中剥离列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55944044/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com