R语言-summary()函数的用法解读-6ren

R语言-summary()函数的用法解读

转载作者：qq735679552 更新时间：2022-09-27 22:32:09

35

4

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章R语言-summary()函数的用法解读由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

summary()：获取描述性统计量，可以提供最小值、最大值、四分位数和数值型变量的均值，以及因子向量和逻辑型向量的频数统计等.

结果解读如下:

R语言-summary()函数的用法解读

。

1. 调用：Call

lm(formula = DstValue ~ Month + RecentVal1 + RecentVal4 + RecentVal6 + RecentVal8 + RecentVal12, data = trainData)

当创建模型时，以上代码表明lm是如何被调用的.

。

2. 残差统计量：Residuals

           Min           1Q        Median         3Q         Max         -4806.5    -1549.1     -171.8      1368.7     6763.3

残差第一四分位数（1Q）和第三分位数（Q3）有大约相同的幅度，意味着有较对称的钟形分布.

。

3. 系数：Coefficients

                              Estimate     Std. Error       t value     Pr(>|t|)         (Intercept)      1.345e+06    5.659e+05     2.377     0.01879 *       Month             8.941e+02    2.072e+02    4.316     3.00e-05 ***

分别表示：估值标准误差 T值 P值。

Intercept：表示截距。

Month：影响因子/特征。

Estimate的列：包含由普通最小二乘法计算出来的估计回归系数.

Std. Error的列：估计的回归系数的标准误差.

P值估计系数不显著的可能性，有较大P值的变量是可以从模型中移除的候选变量.

t 统计量和P值：从理论上说，如果一个变量的系数是0，那么该变量是无意义的，它对模型毫无贡献.

然而，这里显示的系数只是估计，它们不会正好为0.

因此，我们不禁会问：从统计的角度而言，真正的系数为0的可能性有多大？这是t统计量和P值的目的，在汇总中被标记为t value和Pr(>|t|).

其中，我们可以直接通过P值与我们预设的0.05进行比较，来判定对应的解释变量的显著性，我们检验的原假设是：该系数显著为0；若P<0.05，则拒绝原假设，即对应的变量显著不为0.

可以看到Month、RecentVal4、RecentVal8都可以认为是在P为0.05的水平下显著不为0，通过显著性检验；Intercept的P值为0.26714，不显著.

。

4. Multiple R-squared和Adjusted R-squared

这两个值，即R^{2}，常称之为“拟合优度”和“修正的拟合优度”，指回归方程对样本的拟合程度几何，这里我们可以看到，修正的拟合优度=0.8416，表示拟合程度良好，这个值当然是越高越好.

当然，提升拟合优度的方法很多，当达到某个程度，我们也就认为差不多了.

具体还有很复杂的判定内容，有兴趣的可以看看：http://baike.baidu.com/view/657906.htm 。

。

5. F-statistic

F-statistic，是我们常说的F统计量，也成为F检验，常常用于判断方程整体的显著性检验，其值越大越显著；其P值为p-value: < 2.2e-16，显然是<0.05的，可以认为方程在P=0.05的水平上还是通过显著性检验的.

简单总结：

T检验：检验解释变量的显著性；。

R-squared：查看方程拟合程度；。

F检验：是检验方程整体显著性.

如果是一元线性回归方程，T检验的值和F检验的检验效果是一样的，对应的值也是相同的.

补充：在R语言中显示美丽的数据摘要summary统计信息。

。

总结数据集

## Skim summary statistics##  n obs: 150 ##  n variables: 5 ## ## Variable type: factor ##   variable missing complete   n n_unique                       top_counts## 1  Species       0      150 150        3 set: 50, ver: 50, vir: 50, NA: 0##   ordered## 1   FALSE## ## Variable type: numeric ##       variable missing complete   n mean   sd min p25 median p75 max## 1 Petal.Length       0      150 150 3.76 1.77 1   1.6   4.35 5.1 6.9## 2  Petal.Width       0      150 150 1.2  0.76 0.1 0.3   1.3  1.8 2.5## 3 Sepal.Length       0      150 150 5.84 0.83 4.3 5.1   5.8  6.4 7.9## 4  Sepal.Width       0      150 150 3.06 0.44 2   2.8   3    3.3 4.4##       hist## 1 ~xxy||zx## 2 ~xx|zzyy## 3 y~|~}|yy## 4 xy|~zyxx

。

选择要汇总的特定列

## Skim summary statistics##  n obs: 150 ##  n variables: 5 ## ## Variable type: numeric ##       variable missing complete   n mean   sd min p25 median p75 max## 1 Petal.Length       0      150 150 3.76 1.77 1   1.6   4.35 5.1 6.9## 2 Sepal.Length       0      150 150 5.84 0.83 4.3 5.1   5.8  6.4 7.9##       hist## 1 ~xxy||zx## 2 y~|~}|yy

。

处理分组数据

可以处理已使用分组的数据dplyr::group_by.

## Skim summary statistics##  n obs: 150 ##  n variables: 5 ##  group variables: Species ## ## Variable type: numeric ##       Species     variable missing complete  n mean   sd min  p25 median## 1      setosa Petal.Length       0       50 50 1.46 0.17 1   1.4    1.5 ## 2      setosa  Petal.Width       0       50 50 0.25 0.11 0.1 0.2    0.2 ## 3      setosa Sepal.Length       0       50 50 5.01 0.35 4.3 4.8    5   ## 4      setosa  Sepal.Width       0       50 50 3.43 0.38 2.3 3.2    3.4 ## 5  versicolor Petal.Length       0       50 50 4.26 0.47 3   4      4.35## 6  versicolor  Petal.Width       0       50 50 1.33 0.2  1   1.2    1.3 ## 7  versicolor Sepal.Length       0       50 50 5.94 0.52 4.9 5.6    5.9 ## 8  versicolor  Sepal.Width       0       50 50 2.77 0.31 2   2.52   2.8 ## 9   virginica Petal.Length       0       50 50 5.55 0.55 4.5 5.1    5.55## 10  virginica  Petal.Width       0       50 50 2.03 0.27 1.4 1.8    2   ## 11  virginica Sepal.Length       0       50 50 6.59 0.64 4.9 6.23   6.5 ## 12  virginica  Sepal.Width       0       50 50 2.97 0.32 2.2 2.8    3   ##     p75 max     hist## 1  1.58 1.9 xx|~~|yx## 2  0.3  0.6 y~xyyxxx## 3  5.2  5.8 yz|~~zxy## 4  3.68 4.4 xxz|~zyx## 5  4.6  5.1 xzy}}~~z## 6  1.5  1.8 }z~|}yxx## 7  6.3  7   zy~~~z|y## 8  3    3.4 xyz|z~zx## 9  5.88 6.9 y~z~|yxy## 10 2.3  2.5 yx~zz}|z## 11 6.9  7.9 xxz~|zyz## 12 3.18 3.8 xz~~|zxy

。

指定统计信息和类

可以用户使用与该skim_with()功能组合的列表来指定自己的统计信息.

## Skim summary statistics##  n obs: 150 ##  n variables: 5 ## ## Variable type: numeric ##       variable iqr  mad## 1 Sepal.Length 1.3 1.04

以上为个人经验，希望能给大家一个参考，也希望大家多多支持我。如有错误或未考虑完全的地方，望不吝赐教.

原文链接：https://blog.csdn.net/qq_27586341/article/details/92636671 。

最后此篇关于R语言-summary()函数的用法解读的文章就讲到这里了,如果你想了解更多关于R语言-summary()函数的用法解读的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

35

4

0

文章推荐： R语言多线程运算操作(解决R循环慢的问题)

文章推荐： Python读取和存储yaml文件的方法

文章推荐： pycharm上的python虚拟环境移到离线机器上的方法步骤

文章推荐： R语言中cut()函数的用法说明

详解C语言sscanf()函数、vsscanf()函数、vscanf()函数
C语言sscanf()函数：从字符串中读取指定格式的数据头文件： ?
php - 如何解释at()函数； substr()函数;伪代码中的exist()函数
最近，我有一个关于工作预评估的问题，即使查询了每个功能的工作原理，我也不知道如何解决。这是一个伪代码。下面是一个名为foo()的函数，该函数将被传递一个值并返回一个值。如果将以下值传递给foo函数，
VBS教程：函数-CStr 函数
CStr 函数返回表达式，该表达式已被转换为 String 子类型的 Variant。 CStr(expression) expression 参数是任意有效的表达式。说明通常，可以
VBS教程：函数-CSng 函数
CSng 函数返回表达式，该表达式已被转换为 Single 子类型的 Variant。 CSng(expression) expression 参数是任意有效的表达式。说明通常，可
VBS教程：函数-CreateObject 函数
CreateObject 函数创建并返回对 Automation 对象的引用。 CreateObject(servername.typename [, location]) 参数 serv
VBS教程：函数-Cos 函数
Cos 函数返回某个角的余弦值。 Cos(number) number 参数可以是任何将某个角表示为弧度的有效数值表达式。说明 Cos 函数取某个角并返回直角三角形两边的比值。此比值是
VBS教程：函数-CLng 函数
CLng 函数返回表达式，此表达式已被转换为 Long 子类型的 Variant。 CLng(expression) expression 参数是任意有效的表达式。说明通常，您可以使
VBS教程：函数-CInt 函数
CInt 函数返回表达式，此表达式已被转换为 Integer 子类型的 Variant。 CInt(expression) expression 参数是任意有效的表达式。说明通常，可
VBS教程：函数-Chr 函数
Chr 函数返回与指定的 ANSI 字符代码相对应的字符。 Chr(charcode) charcode 参数是可以标识字符的数字。说明从 0 到 31 的数字表示标准的不可打印的
VBS教程：函数-CDbl 函数
CDbl 函数返回表达式，此表达式已被转换为 Double 子类型的 Variant。 CDbl(expression) expression 参数是任意有效的表达式。说明通常，您可
VBS教程：函数-CDate 函数
CDate 函数返回表达式，此表达式已被转换为 Date 子类型的 Variant。 CDate(date) date 参数是任意有效的日期表达式。说明 IsDate 函数用于判断 d
VBS教程：函数-CCur 函数
CCur 函数返回表达式，此表达式已被转换为 Currency 子类型的 Variant。 CCur(expression) expression 参数是任意有效的表达式。说明通常，
VBS教程：函数-CByte 函数
CByte 函数返回表达式，此表达式已被转换为 Byte 子类型的 Variant。 CByte(expression) expression 参数是任意有效的表达式。说明通常，可以
VBS教程：函数-CBool 函数
CBool 函数返回表达式，此表达式已转换为 Boolean 子类型的 Variant。 CBool(expression) expression 是任意有效的表达式。说明如果 ex
VBS教程：函数-Atn 函数
Atn 函数返回数值的反正切值。 Atn(number) number 参数可以是任意有效的数值表达式。说明 Atn 函数计算直角三角形两个边的比值 (number) 并返回对应角的弧
VBS教程：函数-Asc 函数
Asc 函数返回与字符串的第一个字母对应的 ANSI 字符代码。 Asc(string) string 参数是任意有效的字符串表达式。如果 string 参数未包含字符，则将发生运行时错误。
VBS教程：函数-Array 函数
Array 函数返回包含数组的 Variant。 Array(arglist) arglist 参数是赋给包含在 Variant 中的数组元素的值的列表（用逗号分隔）。如果没有指定此参数，则
VBS教程：函数-Abs 函数
Abs 函数返回数字的绝对值。 Abs(number) number 参数可以是任意有效的数值表达式。如果 number 包含 Null，则返回 Null；如果是未初始化变量，则返回 0。
VBS教程：函数-FormatPercent 函数
FormatPercent 函数返回表达式，此表达式已被格式化为尾随有 % 符号的百分比（乘以 100 ）。 FormatPercent(expression[,NumDigitsAfterD
VBS教程：函数-FormatNumber 函数
FormatNumber 函数返回表达式，此表达式已被格式化为数值。 FormatNumber( expression [,NumDigitsAfterDecimal [,Inc

首页

博学

6Ren·AI

商城