gpt4 book ai didi

python - 机器学习: combining features into single feature

转载 作者:行者123 更新时间:2023-11-30 09:09:20 25 4
gpt4 key购买 nike

我是机器学习的初学者。我很困惑如何将数据集的不同特征组合成一个特征。

例如,我在 Python Pandas 数据框架中有一个数据集,其特征如下:

movie        unknown action adventure animation fantasy horror romance sci-fi

Toy Story 0 1 1 0 1 0 0 1
Golden Eye 0 1 0 0 0 0 1 0
Four Rooms 1 0 0 0 0 0 0 0
Get Shorty 0 0 0 1 1 0 1 0
Copy Cat 0 0 1 0 0 1 0 0

我想将这 n 个功能转换为一个名为“movie_genre”的功能。一种解决方案是为每个类型分配一个整数值(未知 = 0、 Action = 1、冒险 = 2 等)并创建一个如下所示的数据框:

movie       genre
Toy Story 1,2,4,7
Golden Eye 1,6
Four Rooms 0
Get Shorty 3,4,6
Copy Cat 2,5

但在这种情况下,列中的条目将不再是整数/浮点值。这会影响我 future 在机器学习过程中的步骤,例如拟合模型和评估算法吗?

最佳答案

将每组 0 和 1 转换为 8 位数字

玩具总动员=01101001

以二进制表示,即 105

同样,黄金眼=01000010 = 26946

您可以在此处手动完成其余操作:http://www.binaryhexconverter.com/binary-to-decimal-converter

以编程方式进行相对简单 - 只需查看每个标签,并为其分配适当的 2 的幂,然后将它们相加

关于python - 机器学习: combining features into single feature,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44203179/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com