gpt4 book ai didi

python - 是否需要在 scikit-learn 中对训练数据进行编码的输入进行编码?

转载 作者:行者123 更新时间:2023-11-30 09:58:19 26 4
gpt4 key购买 nike

我是Python新手。我已经在分类数据上训练了我的算法强文本,在训练过程中我遇到了一些解决方案错误。我看到它需要使用 LabelEncoder 并且我使用了它。至此,问题解决,算法训练完成。

我想知道为什么它不接受原始数据的字符串(编码之前)。有没有办法将字符串字符提供给算法进行预测?这是我的代码:

<小时/>
import pandas as pd
import sklearn
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.neighbors import NearestNeighbors

df=pd.read_csv(r'E:\Study\FYP Data\FYP\datasets\alluni.csv', encoding= 'unicode_escape')
df.head()


Obtained Marks Intermediate Bachelor Institute %age
0 1001.0 FSc. Pre Medical DPT UOS 91.000000
1 1001.0 FSc. Pre Medical DPT UOS 91.000000
2 1010.0 FSc. Pre Medical DPT UOS 91.818182
3 1000.0 FSc. Pre Medical DPT UOS 90.909091
4 1000.0 FSc. Pre Medical DPT UOS 90.909091

le = LabelEncoder()
df['Intermediate'] = le.fit_transform(df.Intermediate.values)
df['Intermediate'] = le.fit_transform(df['Intermediate'])

le = LabelEncoder()
df['Institute'] = le.fit_transform(df.Institute.values)
df['Institute'] = le.fit_transform(df['Institute'])
df.head()

Obtained Marks Intermediate Bachelor Institute
0 1001.0 16 DPT 7
1 1001.0 16 DPT 7
2 1010.0 16 DPT 7
3 1000.0 16 DPT 7
4 1000.0 16 DPT 7

df.drop(['%age'],axis=1,inplace=True)
X=df.drop('Bachelor',axis=1)
y=df['Bachelor']
X_train,X_text,y_train,y_test=train_test_split(X,y,test_size=0.2)

model2=DecisionTreeClassifier()
model2.fit(X_train,y_train)

model2.predict([['980','1','UOS']])

当我使用此代码时,它显示错误:ValueError:无法将字符串转换为 float :'UOS'。是否有任何机制可以提供字符串作为输入?

最佳答案

问题是您使用 LabelEncoder 对训练数据进行编码,但在运行 model2.predict() 时仍然发送原始数据


在运行预测之前尝试使用 LabelEncoder 对数据进行编码

data_encoded = le.transform([['980','1','UOS']])
model2.predict(data_encoded)

关于python - 是否需要在 scikit-learn 中对训练数据进行编码的输入进行编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60116650/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com