- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Mclust 函数(来自 mclust 包)来执行混合高斯聚类。该数据集由 21000+ 行和 10 列组成。
我收到以下错误:
Error in svd(shape.o, nu = 0) : infinite or missing values in 'x'
奇怪的是:1)我检查过 NaN、Inf 等,但没有2)如果我运行 9 个变量的模型,它运行良好,当我添加一个变量时,我收到错误。我尝试过使用一组不同的附加变量,但得到了相同的错误......
你们知道出了什么问题吗?非常感谢。
编辑变量
> str(data_scaled[data_subset, model_variables])
'data.frame': 21304 obs. of 12 variables:
$ PROD_ALL_OR_NOTHING_PERC: num -0.064 -0.064 -0.064 -0.064 0.141 ...
$ PROD_CASH_3_PERC : num -0.212 -0.212 -0.212 1.303 0.686 ...
$ PROD_CASH_4_PERC : num -0.18 -0.18 -0.18 1.09 8.75 ...
$ PROD_EINSTANTS_PERC : num -0.502 0.68 2.329 -0.582 -0.582 ...
$ PROD_FANTASY_5_PERC : num -0.6517 -0.5562 -0.4928 0.0267 -0.6517 ...
$ PROD_GEORGIA_5_PERC : num -0.0563 -0.0563 -0.0563 -0.0563 6.3148 ...
$ PROD_KENO_PERC : num 2.208 1.125 -0.664 0.624 -0.664 ...
$ PROD_MEGA_MILLION_PERC : num -0.687 -0.687 -0.687 -0.523 -0.687 ...
$ PROD_POWERBALL_PERC : num -0.886 -0.886 -0.514 -0.682 -0.886 ...
$ AVG_WAGER : num -0.136 -0.422 -0.416 -0.467 -0.582 ...
$ DEPOSIT_AMOUNT : num 0.3984 0.0928 -0.1745 0.8043 1.2674 ...
$ DEPOSIT_NUM : num 0.485 0.955 -0.22 1.659 3.773 ...
> summary(data_scaled[data_subset, model_variables])
PROD_ALL_OR_NOTHING_PERC PROD_CASH_3_PERC PROD_CASH_4_PERC PROD_EINSTANTS_PERC PROD_FANTASY_5_PERC
Min. :-0.06402 Min. :-0.2122 Min. :-0.1801 Min. :-0.5819 Min. :-0.6517
1st Qu.:-0.06402 1st Qu.:-0.2122 1st Qu.:-0.1801 1st Qu.:-0.5819 1st Qu.:-0.6517
Median :-0.06402 Median :-0.2122 Median :-0.1801 Median :-0.5819 Median :-0.5146
Mean : 0.00000 Mean : 0.0000 Mean : 0.0000 Mean : 0.0000 Mean : 0.0000
3rd Qu.:-0.06402 3rd Qu.:-0.2122 3rd Qu.:-0.1801 3rd Qu.: 0.1934 3rd Qu.: 0.3021
Max. :33.08348 Max. : 7.3222 Max. :11.5193 Max. : 2.8354 Max. : 3.6404
PROD_GEORGIA_5_PERC PROD_KENO_PERC PROD_MEGA_MILLION_PERC PROD_POWERBALL_PERC AVG_WAGER
Min. :-0.05627 Min. :-0.6644 Min. :-0.6873 Min. :-0.8861 Min. :-0.62837
1st Qu.:-0.05627 1st Qu.:-0.6644 1st Qu.:-0.6873 1st Qu.:-0.8861 1st Qu.:-0.45222
Median :-0.05627 Median :-0.6644 Median :-0.4302 Median :-0.4078 Median :-0.29270
Mean : 0.00000 Mean : 0.0000 Mean : 0.0000 Mean : 0.0000 Mean : 0.00000
3rd Qu.:-0.05627 3rd Qu.: 0.4445 3rd Qu.: 0.3513 3rd Qu.: 0.6892 3rd Qu.: 0.07956
Max. :60.46933 Max. : 2.2766 Max. : 4.3167 Max. : 2.4615 Max. :31.21876
DEPOSIT_AMOUNT DEPOSIT_NUM
Min. :-0.1746 Min. :-0.2198
1st Qu.:-0.1746 1st Qu.:-0.2198
Median :-0.1746 Median :-0.2198
Mean : 0.0000 Mean : 0.0000
3rd Qu.:-0.1746 3rd Qu.:-0.2198
Max. :36.2089 Max. :23.5029
最佳答案
r 似乎不喜欢太接近零的数字。我发现如果你将参数乘以 10 或更多,我可以避免错误
BICCtrSD = mclustBIC(Ipsative)
fitting ...
|========= | 18%Error in svd(shape.o, nu = 0) : infinite or missing values in 'x'
BICCtrSD = mclustBIC(Ipsative*10)
fitting ...
|=================================================| 100%
但不要忘记,当您查看结果统计数据时,您已经转换了数据。
这可能更像是一种黑客行为,而不是解决方案本身。
关于R Mclust - 出现 svd 错误 'infinite or missing value',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29750345/
我正在使用 R 的 mclust 库 ( http://www.stat.washington.edu/mclust ) 来进行一些实验性的基于 EM 的 GMM 聚类。该软件包很棒,似乎通常可以为我
在 Ubuntu 20.04 上加载 R 4.0.0 后。 R version 4.0.0 (2020-04-24) -- "Arbor Day" Copyright (C) 2020 The R F
我是初学者,我正在尝试使用 mclust 包对具有 2 个特征 (x, y) 的数据框(有 50,000 条记录)进行聚类。但是,运行命令(例如 Mclust(XXX.df) 或 densityMcl
我在将 mclust 安装到 R 中时遇到一些问题,收到下面的消息,有什么想法吗? install.packages("mclust") Installing package into ‘/home/
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。 我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题,以便
我正在使用 Mclust 函数(来自 mclust 包)来执行混合高斯聚类。该数据集由 21000+ 行和 10 列组成。 我收到以下错误: Error in svd(shape.o, nu = 0)
我正在尝试在 R 中复制 MClust 的 Scikit Learn GMM 中的结果。使用这些数据,我得到的结果在不同的包中是不同的。我在 mixture.GMM 中尝试了不同的协方差结构。如何获得
我是一名优秀的程序员,十分优秀!