gpt4 book ai didi

python - scikit-learn CART 字符串数据

转载 作者:太空宇宙 更新时间:2023-11-03 13:21:55 26 4
gpt4 key购买 nike

你能用字符串数据训练 DecisionTreeClassifier 吗?

当我尝试使用 String 数据时,出现 ValueError: could not converter string to float

clf = DecisionTreeClassifier()<br/>
clf.fit([['asdf', '1'], ['asdf', '0']], ['2', '3'])

最佳答案

您需要将字符串值特征转换为 NumPy 数组中的数字特征; DictVectorizer为你做。

samples = [['asdf', '1'], ['asdf', '0']]
# turn the samples into dicts
samples = [dict(enumerate(sample)) for sample in samples]

# turn list of dicts into a numpy array
vect = DictVectorizer(sparse=False)
X = vect.fit_transform(samples)

clf = DecisionTreeClassifier()
clf.fit(X, ['2', '3'])

请记住在测试样本上使用 vect.transform,将它们转换为字典后。

关于python - scikit-learn CART 字符串数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10940483/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com