gpt4 book ai didi

python - 在数据框的两列之间运行基本关联

转载 作者:太空狗 更新时间:2023-10-30 02:42:55 26 4
gpt4 key购买 nike

我正在尝试能够使用来自指定列的数据从 pandas 数据帧生成相关矩阵

这是我的 csv 数据:

col0,col1,col2,col3,col4
122468.9071,1417464.203,3546600,151804924,10839476
14691.1139,170036.0407,103847,19208604,2365065

这是我创建的两个数据框:

df1 = pd.read_csv('c:/temp/test_1.csv', usecols=[0])
df2 = pd.read_csv('c:/temp/test_1.csv', usecols=[1])

我尝试了 corr 和 corrwith 函数并得到以下错误:

Corr Function:

print df1.corr(df2)

Result:

Error: Could not compare ['pearson'] with block values

Corrwith:

print df1.corrwith(df2)

Result:

col0 NaN
col1 NaN
dtype: float64

如您所见,数据集中没有空值,float64 应该能够处理小数。

如有任何帮助,我们将不胜感激。

提比略

最佳答案

如果您尝试在两列之间创建相关矩阵,我建议将它们放入同一数据框中,如下所示:

df = pd.read_csv('c:/temp/test_1.csv', usecols=[0,1])
df.corr()

我自己将您的数据加载到 csv 中,并得到了一个全为 1 的 2x2 相关矩阵,这是预期的。

您可以在此处找到有关 pandas 相关性的文档:http://pandas.pydata.org/pandas-docs/stable/computation.html#correlation

关于python - 在数据框的两列之间运行基本关联,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35095249/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com