gpt4 book ai didi

python - 将混合数据转换为分类数据 : dataframe

转载 作者:太空宇宙 更新时间:2023-11-03 20:39:47 24 4
gpt4 key购买 nike

我有一列(实际上是几列),其中包含混合类型的数据:分类数据和数值数据(对应于不同的类别)。然而,它们本质上应该是绝对的。我的最终目标是为它们提供一种单热编码表示。

该列中的数值大部分为零。我想将此列转换为分类列。因为我不知道使用 get_dummies() 进行转换的直接方法(混合到 one-hot-encoding)。因此,我先完全转换为数值型,然后再转换为one-hot-encoding。

下图代表了我的场景。

mixed_column

有更好的方法吗?有没有办法直接将数据转换为分类数据。

感谢任何帮助。

最佳答案

下面的代码正确地对具有整数和分类值的列进行了单热编码。这使用了最直接的方式 get_dummies()。如果它不适合您,请考虑使用 another library for categorical encoding .

import pandas as pd
data = {'Column 1':[1,2,'a']}
df = pd.DataFrame(data)
print(pd.get_dummies(df, columns=['Column 1']))

输出:

   Column 1_1  Column 1_2  Column 1_a
0 1 0 0
1 0 1 0
2 0 0 1

关于python - 将混合数据转换为分类数据 : dataframe,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56931749/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com