gpt4 book ai didi

r - R 中显示的摘要很短,许多术语显示为 "Other"

转载 作者:行者123 更新时间:2023-12-04 02:19:23 25 4
gpt4 key购买 nike

如何在不将任何值分类为“其他”的情况下显示完整的输出摘要?

summary(d)
Date.of.Sale City Department Product
1/18/2015 : 149 A:5290 Footwear Mens : 538 13245 : 255
1/25/2015 : 149 B:2078 Home Furnishing:1937 15350 : 255
11/23/2014: 149 C:5088 Infant W-Wear : 992 15352 : 255
11/30/2014: 149 Ladies Lower :1735 15353 : 255
12/14/2014: 149 Ladies Upper :1805 15355 : 255
12/21/2014: 149 Mens Lower :2039 15356 : 255
(Other) :11562 Mens Upper :3410 (Other):10926
Sale Predicted.Sale Flag
0 :3963 0 :3279 Forecast: 1341
Not Available:1341 1 :1951 History :11115
1 :1145 2 : 946
2 : 797 3 : 700
3 : 557 4 : 572
4 : 498 5 : 438
(Other) :4155 (Other):4570

最佳答案

旁白:您的数据似乎有因子列,它们应该是数字。您可能想看看它,因为它可能会在以后的分析中给您带来问题。


就您调用 summary() 而言去,你可以调整maxsum争论。我们在 help(summary) 中找到这可用于更改摘要中显示的信息量

maxsum - integer, indicating how many levels should be shown for factors.

因此,让我们通过一个两列数据框示例来了解一下 -

set.seed(12)
df <- data.frame(
a = sample(letters[1:8], 1e3, TRUE),
b = sample(letters[1:10], 1e3, TRUE)
)

调用 summary()如果没有其他参数,我们会在每列摘要的底部列出“其他”。

summary(df)
# a b
# d :132 g :118
# c :131 b :108
# f :131 e :106
# a :123 f :104
# g :123 d :103
# e :122 j :103
# (Other):238 (Other):358

现在如果我们调整 maxsum到所有列的唯一值的最大数量的长度,我们得到列出的所有值。

summary(df, maxsum = max(lengths(lapply(df, unique))))
# a b
# a:123 a: 94
# b:120 b:108
# c:131 c: 99
# d:132 d:103
# e:122 e:106
# f:131 f:104
# g:123 g:118
# h:118 h: 92
# i: 73
# j:103

请注意 maxsum也可以是 maxsum = length(Reduce(union, df)) ,并且这假定您正在使用数据框。

关于r - R 中显示的摘要很短,许多术语显示为 "Other",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32041022/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com