- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
library(caret)
library(rpart.plot)
car_df <- read.csv("TrainingDataSet.csv", sep = ',', header = TRUE)
str(car_df)
set.seed(3033)
intrain <- createDataPartition(y = car_df$Result, p= 0.7, list = FALSE)
training <- car_df[intrain,]
testing <- car_df[-intrain,]
dim(training)
dim(testing)
anyNA(car_df)
trctrl <- trainControl(method = "repeatedcv", number = 10, repeats = 3)
set.seed(3333)
dtree_fit <- train(Result ~., data = training, method = "rpart",
parms = list(split = "infromation"),
trControl=trctrl,
tuneLength = 10)
我收到此警告:
Warning message: In nominalTrainWorkflow(x = x, y = y, wts = weights, info = trainInfo, : There were missing values in resampled performance measures.
我正在尝试使用积极和消极情绪的数量来对电影是否受欢迎或失败进行分类。这是我的数据
dput(car_df)
structure(list(MovieName = structure(c(20L, 5L, 31L, 26L, 27L,
12L, 36L, 29L, 38L, 4L, 6L, 8L, 10L, 15L, 18L, 21L, 24L, 34L,
35L, 7L, 37L, 25L, 23L, 2L, 11L, 40L, 33L, 28L, 14L, 3L, 17L,
16L, 32L, 22L, 30L, 1L, 19L, 39L, 9L, 13L), .Label = c("#96Movie",
"#alphamovie", "#APrivateWar", "#AStarIsBorn", "#BlackPanther",
"#BohemianRhapsody", "#CCV", "#Creed2", "#CrimesOfGrindelwald",
"#Deadpool2", "#firstman", "#GameNight", "#GreenBookMovie", "#grinchmovie",
"#Incredibles2", "#indivisiblemovie", "#InstantFamily", "#JurassicWorld",
"#KolamaavuKokila", "#Oceans8", "#Overlord", "#PariyerumPerumal",
"#RalphBreaksTheInternet", "#Rampage", "#Ratchasan", "#ReadyPlayerOne",
"#RedSparrow", "#RobinHoodMovie", "#Sarkar", "#Seemaraja", "#Skyscraper",
"#Suspiria", "#TheLastKey", "#TheNun", "#ThugsOfHindostan", "#TombRaider",
"#VadaChennai", "#Venom", "#Vishwaroopam2", "#WidowsMovie"), class = "factor"),
PositivePercent = c(40.10554, 67.65609, 80.46796, 71.34831,
45.36082, 68.82591, 46.78068, 63.85787, 47.20497, 32.11753,
63.7, 39.2, 82.76553, 88.78613, 72.18274, 72.43187, 31.0089,
38.50932, 38.9, 19.9, 84.26854, 29.4382, 58.13953, 86.9281,
64.54965, 56, 0, 56.61914, 58.82353, 54.98891, 78.21682,
90, 64.3002, 85.8, 51.625, 67.71894, 92.21557, 53.84615,
40.12158, 68.08081), NegativePercent = c(11.34565, 21.28966,
6.408952, 13.10861, 26.80412, 17.10526, 18.61167, 10.55838,
46.48033, 56.231, 9.9, 12.1, 9.018036, 6.473988, 13.90863,
16.77149, 63.20475, 42.54658, 40.9, 5.4, 3.907816, 2.022472,
10.51567, 3.267974, 15.12702, 15.3, 100, 18.12627, 11.76471,
13.41463, 5.775076, 10, 20.08114, 2.1, 5.5, 7.739308, 0,
34.61538, 12.86727, 10.70707), Result = structure(c(2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 1L,
1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), .Label = c("Flop", "Hit"
), class = "factor")), class = "data.frame", row.names = c(NA,
-40L))
最佳答案
> str(car_df)
'data.frame': 40 obs. of 4 variables:
$ MovieName : Factor w/ 40 levels "#96Movie","#alphamovie",..: 20 5 31 26 27 12 36 29 38 4 ...
$ PositivePercent: num 40.1 67.7 80.5 71.3 45.4 ...
$ NegativePercent: num 11.35 21.29 6.41 13.11 26.8 ...
$ Result : Factor w/ 2 levels "Flop","Hit": 2 2 2 2 2 2 2 2 2 1 ...
> with(car_df, table( Result))
Result
Flop Hit
5 35
> dtree_fit
CART
29 samples
3 predictor
2 classes: 'Flop', 'Hit'
因此,您得到了 5 次失败的结果,其中一个预测变量是具有 40 个不同值的变量。鉴于您的每个案例都是独特的并且您的结果严重不平衡,这似乎并不奇怪。数据的存在并不能保证得出实质性结论的可能性。如果这里有任何错误,那就是拟合器中缺少代码,它会说“真的吗?你认为统计包应该能够解决数据严重缺乏的问题?”
顺便说一句:应该是(但不出所料,没有清除警告):
(split = "information")
如果将交叉验证 bin 的数量更改为允许将触发器分布在各个 bin 之间的数字,那么您可以获得非警告结果。鉴于样本量较小,它是否具有很大的有效性仍然值得怀疑:
> trctrl <- trainControl(method = "repeatedcv", number = 3, repeats = 3)
set.seed(3333)
dtree_fit <- train(Result ~., data = training, method = "rpart",
parms = list(split = "infromation"),
trControl=trctrl,
tuneLength = 10)
# no warning on one of my runs
关于r - r 中的决策树没有用我的训练数据形成,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53473161/
初学者 android 问题。好的,我已经成功写入文件。例如。 //获取文件名 String filename = getResources().getString(R.string.filename
我已经将相同的图像保存到/data/data/mypackage/img/中,现在我想显示这个全屏,我曾尝试使用 ACTION_VIEW 来显示 android 标准程序,但它不是从/data/dat
我正在使用Xcode 9,Swift 4。 我正在尝试使用以下代码从URL在ImageView中显示图像: func getImageFromUrl(sourceUrl: String) -> UII
我的 Ubuntu 安装 genymotion 有问题。主要是我无法调试我的数据库,因为通过 eclipse 中的 DBMS 和 shell 中的 adb 我无法查看/data/文件夹的内容。没有显示
我正在尝试用 PHP 发布一些 JSON 数据。但是出了点问题。 这是我的 html -- {% for x in sets %}
我观察到两种方法的结果不同。为什么是这样?我知道 lm 上发生了什么,但无法弄清楚 tslm 上发生了什么。 > library(forecast) > set.seed(2) > tts lm(t
我不确定为什么会这样!我有一个由 spring data elasticsearch 和 spring data jpa 使用的类,但是当我尝试运行我的应用程序时出现错误。 Error creatin
在 this vega 图表,如果我下载并转换 flare-dependencies.json使用以下 jq 到 csv命令, jq -r '(map(keys) | add | unique) as
我正在提交一个项目,我必须在其中创建一个带有表的 mysql 数据库。一切都在我这边进行,所以我只想检查如何将我所有的压缩文件发送给使用不同计算机的人。基本上,我如何为另一台计算机创建我的数据库文件,
我有一个应用程序可以将文本文件写入内部存储。我想仔细看看我的电脑。 我运行了 Toast.makeText 来显示路径,它说:/数据/数据/我的包 但是当我转到 Android Studio 的 An
我喜欢使用 Genymotion 模拟器以如此出色的速度加载 Android。它有非常好的速度,但仍然有一些不稳定的性能。 如何从 Eclipse 中的文件资源管理器访问 Genymotion 模拟器
我需要更改 Silverlight 中文本框的格式。数据通过 MVVM 绑定(bind)。 例如,有一个 int 属性,我将 1 添加到 setter 中的值并调用 OnPropertyChanged
我想向 Youtube Data API 提出请求,但我不需要访问任何用户信息。我只想浏览公共(public)视频并根据搜索词显示视频。 我可以在未经授权的情况下这样做吗? 最佳答案 YouTube
我已经设置了一个 Twilio 应用程序,我想向人们发送更新,但我不想回复单个文本。我只是想让他们在有问题时打电话。我一切正常,但我想在发送文本时显示传入文本,以确保我不会错过任何问题。我正在使用 p
我有一个带有表单的网站(目前它是纯 HTML,但我们正在切换到 JQuery)。流程是这样的: 接受用户的输入 --- 5 个整数 通过 REST 调用网络服务 在服务器端运行一些计算...并生成一个
假设我们有一个名为 configuration.js 的文件,当我们查看内部时,我们会看到: 'use strict'; var profile = { "project": "%Projec
这部分是对 Previous Question 的扩展我的: 我现在可以从我的 CI Controller 成功返回 JSON 数据,它返回: {"results":[{"id":"1","Sourc
有什么有效的方法可以删除 ios 中 CBL 的所有文档存储?我对此有疑问,或者,如果有人知道如何从本质上使该应用程序像刚刚安装一样,那也会非常有帮助。我们正在努力确保我们的注销实际上将应用程序设置为
我有一个 Rails 应用程序,它与其他 Rails 应用程序通信以进行数据插入。我使用 jQuery $.post 方法进行数据插入。对于插入,我的其他 Rails 应用程序显示 200 OK。但在
我正在为服务于发布请求的 API 调用运行单元测试。我正在传递请求正文,并且必须将响应作为帐户数据返回。但我只收到断言错误 注意:数据是从 Azure 中获取的 spec.js const accou
我是一名优秀的程序员,十分优秀!