gpt4 book ai didi

python - python 线性回归中字符串的预测

转载 作者:行者123 更新时间:2023-11-30 09:50:12 25 4
gpt4 key购买 nike

我有一个包含三列类型/名称/价格的数据集,想要根据类型和名称预测价格。这里的类型/名称是分类字符串值。 Price 是数字目标变量。

我的数据集如下所示:

Type Name Price
A ec1 1.5
B ec2 2
A ec2 3
C ec1 1
B ec3 1

我必须为此数据集创建一个模型,并希望预测类型/名称。Type-A 和 Name ec2 的预计价格是多少?能否提供一下示例代码。

此外,数据集不会有固定数量的列。仅目标变量固定为价格。自变量可能具有类型/名称/日期等字段。

最佳答案

对输入数据使用字典向量化器。它将您的分类特征转换为向量的二进制特征。

在这里阅读更多相关信息:http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.DictVectorizer.html#sklearn.feature_extraction.DictVectorizer

如果我以您的数据集为例,它将看起来像这样:

data = [{"type": A, "name": ec1},
{"type": B, "name": ec2},
{"type": A, "name": ec2},
{"type": C, "name": ec1},
{"type": B, "name": ec3}]

from sklearn.feature_extraction import DictVectorizer

vectorizer = DictVectorizer()
vector_data = vectorizer.fit_transform(data)

现在您的vector_data已准备好用于机器学习模型。

关于python - python 线性回归中字符串的预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46588660/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com