gpt4 book ai didi

python - Pandas DataFrame 中两个非数字列之间的相关性

转载 作者:太空狗 更新时间:2023-10-30 02:38:27 25 4
gpt4 key购买 nike

我通过 SQL 查询从表中获取数据到我的 pandas 数据框。数据如下:

        group  phone_brand
0 M32-38 小米
1 M32-38 小米
2 M32-38 小米
3 M29-31 小米
4 M29-31 小米
5 F24-26 OPPO
6 M32-38 酷派
7 M32-38 小米
8 M32-38 vivo
9 F33-42 三星
10 M29-31 华为
11 F33-42 华为
12 F27-28 三星
13 M32-38 华为
14 M39+ 艾优尼
15 F27-28 华为
16 M32-38 小米
17 M32-38 小米
18 M39+ 魅族
19 M32-38 小米
20 F33-42 三星
21 M23-26 小米
22 M23-26 华为
23 M27-28 三星
24 M29-31 小米
25 M32-38 三星
26 M32-38 三星
27 F33-42 三星
28 M32-38 三星
29 M32-38 三星
... ... ...
74809 M27-28 华为
74810 M29-31 TCL

现在我想从这两列中找出相关性和频率,并用 Matplotlib 将其可视化。我试过类似的东西:

DataFrame.plot(style='o')
plt.show()

现在如何以最简单的方式可视化这种相关性?

最佳答案

快速获得相关性:

df.apply(lambda x: x.factorize()[0]).corr()

group phone_brand
group 1.000000 0.427941
phone_brand 0.427941 1.000000

热图

import seaborn as sns

sns.heatmap(pd.crosstab(df.group, df.phone_brand))

enter image description here

关于python - Pandas DataFrame 中两个非数字列之间的相关性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47002168/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com