gpt4 book ai didi

python - 如何绘制具有逆变换(实际)值的 graphviz 决策树?

转载 作者:行者123 更新时间:2023-12-05 07:23:15 28 4
gpt4 key购买 nike

我正在使用 graphviz 绘制分类决策树。

在适应特征之前,我使用“preprocessing.StandardScaler()”来缩放它们

因此,当我绘制决策树时,我会根据“转换后的值”绘制它

有没有办法在绘制分类器之前对分类器进行“inverse_trasform”,以便决策树绘制节点处的实际值而不是转换后的值?

是的,我试过 scale.inverse_transform(rf_clf) ....但当然不要工作......

从sklearn.datasets导入数据集

iris = datasets.load_iris()

从字典创建数据框

species = [iris.target_names[x] for x in iris.target]
iris = pd.DataFrame(iris['data'], columns = ['Sepal_Length', 'Sepal_Width', 'Petal_Length', 'Petal_Width'])
iris['Species'] = species

转换为数组

Features = np.array(iris[['Sepal_Length', 'Sepal_Width', 'Petal_Length', 'Petal_Width']])

levels = {'setosa':0, 'versicolor':1, 'virginica':2}
Labels = np.array([levels[x] for x in iris['Species']])

split

nr.seed(1115)
indx = range(Features.shape[0])
indx = ms.train_test_split(indx, test_size = 100)
X_train = Features[indx[0],:]
y_train = np.ravel(Labels[indx[0]])
X_test = Features[indx[1],:]
y_test = np.ravel(Labels[indx[1]])

缩放:

scale = preprocessing.StandardScaler()
scale.fit(X_train)
X_train = scale.transform(X_train)

拟合分类器

rf_clf = tree.DecisionTreeClassifier() ###simple TREE
rf_clf.fit(X_train, y_train)*

用 graphviz 绘制决策树:

dot_data = tree.export_graphviz(rf_clf, out_file=None, 

feature_names=['Sepal_Length', 'Sepal_Width', 'Petal_Length', 'Petal_Width'],
class_names=['setosa', 'versicolor', 'virginica'],

filled=True, rounded=True,
special_characters=True)

print(dot_data)

graph = graphviz.Source(dot_data)
graph

第一个节点的结果是“Petal_width<= 0.53”,第二个节点的结果是“petal lenght <= -0.788”,是实数的负数。

我更愿意让树承载以英寸为单位的实际值...

最佳答案

您可以遍历树并自行设置节点阈值。

如果你考虑这个遍历树的例子:https://scikit-learn.org/stable/auto_examples/tree/plot_unveil_tree_structure.html#sphx-glr-auto-examples-tree-plot-unveil-tree-structure-py

哪里写着 print("%snode=%s test node: go to node %s if X[:, %s] <= %s else to node %s."...您可以重写阈值并将缩放器的 inverse_transform 函数用于被测功能。

transformed = np.empty(X_train.shape[1])
transformed[:] = np.nan
transformed[feature[i]] = threshold[i]
threshold[i] = scale.inverse_transform(transformed)[feature[i]]

您生成的点文件将包含更新后的值。但是,您将无法再使用具有缩放功能的树进行预测。

注意:阈值的值与没有缩放时并不完全相同,我不确定缩放器是否应该对阈值产生那样的影响。

关于python - 如何绘制具有逆变换(实际)值的 graphviz 决策树?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56100184/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com