gpt4 book ai didi

python - Pandas scatter_matrix - 绘制分类变量

转载 作者:太空狗 更新时间:2023-10-29 21:37:03 24 4
gpt4 key购买 nike

我正在查看 Kaggle 竞赛中著名的泰坦尼克号数据集:http://www.kaggle.com/c/titanic-gettingStarted/data

我已使用以下方式加载和处理数据:

# import required libraries
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

# load the data from the file
df = pd.read_csv('./data/train.csv')

# import the scatter_matrix functionality
from pandas.tools.plotting import scatter_matrix

# define colors list, to be used to plot survived either red (=0) or green (=1)
colors=['red','green']

# make a scatter plot
scatter_matrix(df,figsize=[20,20],marker='x',c=df.Survived.apply(lambda x:colors[x]))

df.info()

scatter_matrix from matplotlib

如何将 Sex 和 Embarked 等分类列添加到图中?

最佳答案

您需要将分类变量转换为数字以绘制它们。

示例(假设“性别”列包含性别数据,“M”代表男性,“F”代表女性)

df['Sex_int'] = np.nan
df.loc[df['Sex'] == 'M', 'Sex_int'] = 0
df.loc[df['Sex'] == 'F', 'Sex_int'] = 1

现在所有女性都用 0 表示,男性用 1 表示。未知性别(如果有的话)将被忽略。

您的其余代码应该可以很好地处理更新后的数据框。

关于python - Pandas scatter_matrix - 绘制分类变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28034424/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com