r - R 中的 C5.0 机器学习，测试数据准确率 100%-6ren

r - R 中的 C5.0 机器学习，测试数据准确率 100%

转载作者：行者123 更新时间：2023-11-30 10:00:25

25

4

我正在做一个机器学习项目，并使用 C5.0 决策树来查看乳腺癌数据，尝试预测诊断为恶性或良性。该数据集是 UCI 机器学习数据集之一，发布在以下链接:https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Diagnostic%29 。

我认为我的代码对于模型来说是正确的，但是每当我针对测试数据运行它时，它都会显示该数据的准确性为 100%。我假设这意味着我做错了什么，但我不确定是什么:

#Load Library
library(C50)
library(gmodels)
library(tidyverse)
library(dplyr)

#Import Data
setwd("C:\\Users\\Grant\\Downloads")
wdbc<-read.delim("C:\\Users\\Grant\\Downloads\\wdbc.txt", header=TRUE, sep=",")

#Need to convert it to factor
wdbc2=mutate(wdbc, Diagnosis=as.factor(diagnosis))

#Randomize Sequence
set.seed(12345)
wdbc_rand<-wdbc2[order(runif(569)), ]

#Split into training vs. test data
wdbc_train<-wdbc_rand[1:512, ]
wdbc_test<-wdbc_rand[512:569, ]


#Create Model
wdbc_model<-C5.0(x=wdbc_train[-2], y=wdbc_train$Diagnosis)

#Evaluate Performance
wdbc_pred <- predict(wdbc_model, wdbc_test)
CrossTable(wdbc_test$Diagnosis, wdbc_pred, prop.chisq = FALSE,
           prop.c = FALSE, prop.r = FALSE, dnn= c('actual diagnosis', 'predicted diagnosis'))

任何帮助或我可能在这里做错的潜在事情将非常感激

最佳答案

还无法输入评论(需要 50 点声誉点)，所以我将在此处输入。代码看起来是正确的，但我认为准确性不是100%。在 3 种情况下，预测为 B，而诊断为 M。您在训练模型时也使用 ID 作为预测变量，我也会将其删除。

关于r - R 中的 C5.0 机器学习，测试数据准确率 100%，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59243343/

25

4

0

文章推荐： machine-learning - Tensorflow 2 异或实现

文章推荐： java - 如何使用 ViewModel 在 Fragment 之间共享数据

文章推荐： javascript - 如何使用 JS 和 CSS 制作 float 导航栏？

python - LSTM 0 准确率
我训练了 LSTM 分类模型，但得到了奇怪的结果(0 准确率)。这是我的带有预处理步骤的数据集: import pandas as pd from sklearn.model_selection im
machine-learning - TFlearn 准确率
使用 TFlearn 构建 DNN 后，我想计算网络的准确性。这是代码: def create_model(self): x = tf.placeholder(dtype= tf.float
machine-learning - 如何使用SVM求精确率、召回率、准确率？
Duplicate calculating Precision, Recall and F Score 我有一个带有文本描述和分类级别(即levelA和levelB)的输入文件。我想编写一个 SVM
python - 如何使用 PyTorch 获得语义分割中的 top k 准确率？
如何计算语义分割中前 k 个准确率？在分类中，我们可以将 topk 准确率计算为: correct = output.eq(gt.view(1, -1).expand_as(output)) 最佳答案
python-2.7 - OnVsRestClassifier 给出 0 准确率
我正在尝试解决多标签分类问题 from sklearn.preprocessing import MultiLabelBinarizer traindf = pickl

首页

博学

6Ren·AI

商城

r - R 中的 C5.0 机器学习，测试数据准确率 100%