- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
尝试使用集群
中的daisy
函数将具有数字、标称和NA值的data.frame
转换为相异矩阵我的目的是在应用 k 均值聚类进行客户分割之前创建一个相异矩阵。 data.frame
有 133,153 行和 36 列。这是我的机器。
sessionInfo()
R version 3.1.0 (2014-04-10)
Platform x86_64-w64-mingw32/x64 (64-bit)
如何修复雏菊警告?
由于 Windows 计算机具有 3 Gb RAM,因此我将虚拟内存增加到 100GB,希望这足以创建矩阵 - 但它不起作用。我仍然有一些关于内存的错误。我研究过其他 R 包来解决内存问题,但它们不起作用。我无法将 bigmemory
与 biganalytics
包一起使用,因为它只接受数字矩阵。 clara
和 ff
包也只接受数字矩阵。
CRAN 的 cluster
包建议在应用 k 均值之前将 gower 相似系数作为距离度量。高尔系数采用数值、标称和 NA 值。
Store1 <- read.csv("/Users/scdavis6/Documents/Work/Client1.csv", head=FALSE)
df <- as.data.frame(Store1)
save(df, file="df.Rda")
library(cluster)
daisy1 <- daisy(df, metric = "gower", type = list(ordratio = c(1:35)))
#Error in daisy(df, metric = "gower", type = list(ordratio = c(1:35))) :
#long vectors (argument 11) are not supported in .C
**编辑:我将 RStudio 连接到 Amazon Web Service (AWS) r3.8xlarge,具有 244Gbs 内存和 32 个 vCPU。我尝试在计算机上创建菊花矩阵,但没有足够的 RAM。 **
**编辑2:我使用 clara 函数对数据集进行聚类。 **
#50 samples
clara2 <- clara(df, 3, metric = "euclidean", stand = FALSE, samples = 50,
rngR = FALSE, pamLike = TRUE)
最佳答案
如果您有大量数据,请使用不需要 O(n^2) 内存的算法。交换到磁盘会降低性能,这不是一个明智的选择。
相反,请尝试减小数据集大小,或使用索引加速来避免 O(n^2) 内存成本。 (而且它不仅需要 O(n^2) 内存,而且还需要 O(n^2) 距离计算,这将需要很长时间!)
关于R 集群包错误 Daisy() 函数长向量(参数 11)在 .C 中不受支持,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24277999/
我正在关注http://scikit-image.org/docs/0.11.x/auto_examples/plot_daisy.html ,但是不太清楚 desc[0],desc[1] 和 des
在阅读了整个 SVN 的 README.txt 之后,我已经遵循了它们,但仍然缺少构建 Fortify Sourceanalyzer 所需的一些依赖项。 这些依赖项是 DocumentEdit
我正在使用 skimage 和 sklearn 来训练数据集 food101 的图像分类器 def process_image(image_fp): image_ = imread(image_fp)
我想在daisyui中自定义一个主题。是否可以自定义,即深色主题(只需修复一种颜色,或添加更多颜色条目)? 进一步:是否可以为您的自定义主题添加新的颜色条目? 即我尝试了以下但没有成功: dais
我正试图将 250 个物种的行为特征归纳为生活史策略。特征数据由数值变量和名义变量组成。我对 R 和聚类分析比较陌生,但我相信找到这些点的距离的最佳选择是在雏菊函数中使用 gower 相似性方法。 1
我有一个包含分类(名义和有序)和数值属性的数据集。我想使用这些混合属性计算我的观察结果的(不)相似性矩阵。使用 daisy() R中集群包的功能,我可以很容易地得到一个相异矩阵如下: if(!requ
我正在研究 Go 并发模式。 我不确定的一种模式是: Daisy Chain https://talks.golang.org/2012/concurrency.slide#39 我很难理解代码的控制
- (void)main { IDBAssert0(self.bestCapture.webpCandidate); self.finished = NO; self.executing = YES;
我想计算两个数据帧的行之间的距离(相异性),以便为每个观察找到最接近的簇。因为我有因子和数值变量,所以我使用高尔距离。由于我想比较两个数据帧(而不是一个矩阵的行之间的差异), gower.dist 将
我有一个包含混合数据类型(整数、字符和逻辑)的数据框,我试图将其与 Daisy 聚类。 我正在使用: gower_dist <- daisy(relchoice, metric = "gower")
我想创建一个风车(如 msnbc 应用程序)。请看下图。我如何创建一个风车。是否有可用的示例代码或教程?请指导我如何实现这一点? Sample Image http://www.freeimageho
尝试使用集群中的daisy函数将具有数字、标称和NA值的data.frame转换为相异矩阵我的目的是在应用 k 均值聚类进行客户分割之前创建一个相异矩阵。 data.frame 有 133,153 行
我有一个 DAISY zipper 从 OpenLibrary.org 下载的文件。如何将其转换为 pdf/epub/word 文档? 最佳答案 我认为你很困惑。 DAISY 书籍主要是有声读物。 来
我试图从官方存储库为 beaglebone black 构建 Linux https://github.com/beagleboard/linux 我能够获取并运行 menuconfig,但是当我尝试
我是一名优秀的程序员,十分优秀!