gpt4 book ai didi

csv - 将分类数据从 CSV 导入 scikit-learn

转载 作者:行者123 更新时间:2023-12-04 20:47:03 24 4
gpt4 key购买 nike

我想从 CSV 文件导入数据以在 scikit-learn 中使用。它混合了数值数据分类数据,例如

someValue,color,someOtherValue
1.2,red,55.6
1.9,blue,20.5
3.2,red,16.5

我需要将此表示转换为纯数字表示,其中分类数据点转换为多个二进制列,例如
someValue,colorIsRed,colorIsBlue,someOtherValue
1.2,1,0,55.6
1.9,0,1,20.5
3.2,1,0,16.5

是否有任何实用程序可以为我执行此操作,或者是否有一种简单的方法来遍历数据并获得此表示?

最佳答案

据我所知,scikit-learn 不提供数据加载功能,但它确实更喜欢 Numpy 数组作为输入。 Numpy 的 loadtxt 函数及其 converters 参数可用于加载 csv 并指定每列的类型。不过,它不会将您的第二列二值化。

关于csv - 将分类数据从 CSV 导入 scikit-learn,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11768603/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com