R-confusionMatrix()-sort.list(y) : 'x' must be atomic for 'sort.list' 中的错误-6ren

R-confusionMatrix()-sort.list(y) : 'x' must be atomic for 'sort.list' 中的错误

转载作者：行者123 更新时间：2023-11-30 08:40:58

24

4

我正在尝试使用带有随机森林的 train() 来做实用机器学习的 coursera 项目。不过我遇到了两个问题。由于原始数据集相当大，我用 2 个小数据框复制了该问题，如下所示。

输入

library(caret)
f = data.frame(x = 1:10, y = 11:20)
f2 = data.frame(x = 1:5, y = 6:10)
fit <- train(y~., data = f, method="lm")
pred <- predict(fit, newdata = f2)
confusionMatrix(pred, f2)

输出(主要问题)

Error in sort.list(y) : 'x' must be atomic for 'sort.list'
Have you called 'sort' on a list?

如果我使用 table 函数而不是 confusionMatrix，我会得到以下结果:

Error in table(pred, data = f2) : all arguments must have the same length

虽然 pred 的长度为 5，f2$y 的长度也是 5。

顺便说一句，这个例子中的 fit 函数有时也会给我一个我也不明白的错误。

Warning message:
In nominalTrainWorkflow(x = x, y = y, wts = weights, info = trainInfo,  :
There were missing values in resampled performance measures.

编辑:语法

最佳答案

我认为您遇到了三个问题。

confusionMatrix期待两个向量，但是 f2是一个数据框。相反，做 confusionMatrix(pred, f2$y) 。
但这会产生不同的错误:The data must contain some levels that overlap the reference. 。这就提出了第二个问题。如果您查看 f2 的预测值和实际值，没有重叠。本质上，f和f2代表 x 之间完全不同的关系和y 。您可以通过绘图看到这一点。
```
library(tidyverse)
theme_set(theme_classic())

ggplot(bind_rows(f=f,f2=f2, .id="source"), aes(x,y,colour=source)) +
  geom_point() +
  geom_smooth(method="lm") 
```
此外，假数据中没有噪声，因此拟合非常完美(RMSE = 0 且 R 平方 = 1)。
```
fit
```
```
Resampling results:

  RMSE          Rsquared
  1.650006e-15  1
```
假数据集具有连续的结果变量。然而，混淆矩阵是检查分类模型质量的工具，即结果是分类的而不是连续的数据。在这种情况下，您将使用逻辑回归、随机森林等适合分类的模型，而不是线性回归模型。然后你会使用 confusionMatrix将预测类(class)与实际类(class)进行比较。

这是一个例子:

library(caret)

# Fake data
set.seed(100)
f = data.frame(y = c(rep(c("A","B"), c(100,25)),rep(c("B","A"), c(100,25))),
               x = c(rnorm(125, 1, 1), rnorm(125, 3, 1)))

# Train model on training data
set.seed(50)
idx = sample(1:nrow(f), 200)  # Indices of training observations
fit <- train(y ~ ., data = f[idx,], method="glm")

# Get predictions on probability scale
pred <- predict(fit, newdata=f[-idx, ], type="prob")

# Create data frame for confusion matrix
results = data.frame(pred=ifelse(pred$A < 0.5, "B","A"),
                     actual=f$y[-idx])

confusionMatrix(results$pred, results$actual)

Confusion Matrix and Statistics

          Reference
Prediction  A  B
         A 16  7
         B  6 21

               Accuracy : 0.74            
                 95% CI : (0.5966, 0.8537)
    No Information Rate : 0.56            
    P-Value [Acc > NIR] : 0.006698        

                  Kappa : 0.475           
 Mcnemar's Test P-Value : 1.000000        

            Sensitivity : 0.7273          
            Specificity : 0.7500          
         Pos Pred Value : 0.6957          
         Neg Pred Value : 0.7778          
             Prevalence : 0.4400          
         Detection Rate : 0.3200          
   Detection Prevalence : 0.4600          
      Balanced Accuracy : 0.7386          

       'Positive' Class : A

关于R-confusionMatrix()-sort.list(y) : 'x' must be atomic for 'sort.list' 中的错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45774944/

24

4

0

文章推荐： java - Thymeleaf - 输入动态字符串列表

文章推荐： java - 如何调用未知对象的方法

文章推荐： java - 无论数组级别如何，如何识别多级数组对象类类型？

文章推荐： apache-spark - Apache Spark 用户推荐？

sorting - 性能 : Sorting Slice vs Sorting Type (of Slice) with Sort implementation
我在玩一些代码挑战时发现自定义排序(排序接口(interface)的实现)比仅针对 slice 的原始结构要快得多。这是为什么？将 slice 转换为类型是否会产生一些魔力(例如转换为指向结构的指针
reactjs - 未找到规则 'simple-import-sort/sort' 的定义 simple-import-sort/sort
我正在使用 simple-import-sort eslint 插件进行 react 。我想我的 .eslintrc.js是对的，但我无法使这个特定的插件工作。我在文件的第一行收到以下错误: 未找到规
sorting - sort.Slice排序不正确
Closed. This question is not reproducible or was caused by typos。它当前不接受答案。想改善这个问题吗？更新问题，以便将其作为on-to
golang 不能在 sort.Sort 的参数中使用类型作为类型 sort.Interface
好的，所以我是 Go 的新手，我正在努力让自己熟悉按函数排序。我可能误解了什么，所以如果我错了请纠正我。我正在尝试创建一个包含字段 key 和 value 的 Nodes 数组。我想创建一个自定义排
sorting - `take n (sort xs)` ("sorted prefix") 问题的内存高效算法
我想从惰性列表中取出 n 个最大的元素。我听说在 Data.List.sort 中实现的合并排序是惰性的，它不会产生不必要的元素。就比较而言，这可能是正确的，但在内存使用方面肯定不是这样。下面的程序
javascript - 两个回调作为 Array.sort() 的参数，而不是 Array.sort().sort()
这个问题已经有答案了: Javascript sort function. Sort by First then by Second (10 个回答) 已关闭 3 年前。我正在尝试返回已排序产品的列
c++ - 成对 vector : first pair values are non-sorted and second pair values are sorted: how to find a sorted value when having the non-sorted one
我有一个 vector 对，如下所示。第一对值未排序，第二对值已排序(从零开始)。我可能想通过实现 std::vector 和 std::pair 来存储数据。当我有第一对值(未排序)时，找到相应的第
nstableview - swift 3 : Sort (formerly sort-in-place) array by sort descriptors
直到现在(Swift 2.2)我一直愉快地使用来自 this answer 的代码- 它迅速，优雅，它像梦一样工作。 extension MutableCollectionType where Ind
sorting - Golang Sort :does not implement sort. 接口(interface)(缺少 Len 方法)
我在我的 Go 应用程序中实现排序界面时遇到问题。这是相关代码: type Group struct { Teams []*Team } type Team struct { Point
sorting - table.sort 使用什么算法？
我很好奇 Lua 的默认算法是什么 table.sort使用，只是因为它比我遇到的其他一些排序算法慢。我也很好奇 Lua 的 table.sort是在引擎中用 C 编写的，或者如果它在 Lua 中的库
sorting - "partially sorted"的数学定义
例如，插入排序被描述为部分排序数组的有效算法。但如何精确定义“部分排序”呢？最佳答案这是一个只有少数元素不合适的数组。如果没有指定百分比或其他阈值，则部分排序和未排序之间没有严格的区别。正式定义
sorting - Thrust::sort 有多快以及最快的基数排序实现是什么
我是 GPU 编程的新手。最近，我正在尝试根据一个教程实现gpu bvh构建算法:http://devblogs.nvidia.com/parallelforall/thinking-parallel
sorting - Gnumeric Sort 函数
有人可以指导我 Gnumeric 排序函数的详细说明(链接)吗？ Gnumeric 手册很简短并且没有示例。我无法通过搜索引擎找到任何合适的信息，甚至 Stackoverflow 上也只有六个不合适的
Python sort and sorted -- 列表的列表如何精确排序？
在 Python 中使用什么精确规则来对列表进行排序，其中元素是列表？这可以表示为“key”或“cmp”吗功能？问题来自于有两件事考虑:长度和它们位置的值。 sorted([ [ 0, 1, 2
go - sort.Sort 不修改数组
下面的代码应该创建一个整数数组 (a) 并对它进行排序，但是 sort.Sort 似乎没有修改变量。 package main import ( "fmt" "sort" ) type
sorting - golang sort.Sort随机输出并且是错误的
我有一个应用于结构的自定义排序函数。完整代码是 here on play.golang.org . type Stmt struct { Name string After []st
对python3 sort sorted 函数的应用详解
python3 sorted取消了对cmp的支持。 python3 帮助文档： ?
algorithm - Shellsort - 如果一个数组是 g-sorted 然后 h-sorted，数组仍然是 g-sorted
以下是来自普林斯顿的 coursera 算法类(class)的练习。如果一个数组既是 3 次排序又是 5 次排序，那么它是否也是 6 次、7 次、8 次、9 次和 10 次排序？我知道任何序列如果先
algorithm - "A g-sorted array remains g-sorted even after h-sorting it"的含义是什么？
当我看到上面的语句时，我正在阅读 shell-sorting。这意味着什么？它对我看待 shell 排序的方式有何不同？ PS:我不是在寻找声明的证据。最佳答案好吧，你可能暗示下一个排序阶段不会“
mysql Sort aborted: Out of sort memory, consider increasing server sort buffer size的解决方法
今天在检查mysql服务器的时候提示Sort aborted: Out of sort memory, consider increasing server sort buffer size，安装字

首页

博学

6Ren·AI

商城

R-confusionMatrix()-sort.list(y) : 'x' must be atomic for 'sort.list' 中的错误