gpt4 book ai didi

r - data.frame : locations of NAs and much more 的视觉结构

转载 作者:行者123 更新时间:2023-12-04 02:07:28 26 4
gpt4 key购买 nike

我想用颜色编码在单个绘图上表示数据框(或矩阵,或 data.table 等)的结构。我想这对于处理各种类型数据的许多人来说非常有用,可以一目了然地将其可视化。

也许有人已经开发了一个包来做到这一点,但我找不到一个(只是 this )。所以这是我的“愿景”的粗略模型,一种热图,以颜色代码显示:

  • 北美地区,
  • 变量类别(因子(多少级?)、数字(带有颜色渐变、零、异常值...)、字符串)
  • 尺寸
  • 等等....

  • enter image description here

    到目前为止,我刚刚编写了一个函数来绘制 NA 位置,如下所示:
    ggSTR = function(data, alpha=0.5){
    require(ggplot2)
    DF <- data
    if (!is.matrix(data)) DF <- as.matrix(DF)

    to.plot <- cbind.data.frame('y'=rep(1:nrow(DF), each=ncol(DF)),
    'x'=as.logical(t(is.na(DF)))*rep(1:ncol(DF), nrow(DF)))
    size <- 20 / log( prod(dim(DF)) ) # size of point depend on size of table
    g <- ggplot(data=to.plot) + aes(x,y) +
    geom_point(size=size, color="red", alpha=alpha) +
    scale_y_reverse() + xlim(1,ncol(DF)) +
    ggtitle("location of NAs in the data frame")

    pc <- round(sum(is.na(DF))/prod(dim(DF))*100, 2) # % NA
    print(paste("percentage of NA data: ", pc))

    return(g)
    }

    它接受输入中的任何 data.frame 并返回此图像:

    enter image description here

    实现第一张图片对我来说挑战太大。

    最佳答案

    我知道有一个包可以轻松显示缺失值,但我的 google-fu 目前不太好。然而,我确实找到了一个名为 tableplot 的函数。 ,这将使您对数据框有一个全面的了解。我不知道它是否会向您显示丢失的数据。

    这是链接:

    http://www.ancienteco.com/2012/05/quickly-visualize-your-whole-dataset.html

    关于r - data.frame : locations of NAs and much more 的视觉结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27545423/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com