r - 缩尾数据框-6ren

r - 缩尾数据框

转载作者：行者123 更新时间：2023-12-02 02:19:33

我想在这样的数据框中执行缩尾化:

event_date  beta_before     beta_after
2000-05-05  1.2911707054    1.3215648954
1999-03-30  0.5089734305    0.4269575657
2000-05-05  0.5414700258    0.5326762272
2000-02-09  1.5491034852    1.2839988507
1999-03-30  1.9380674599    1.6169735009
1999-03-30  1.3109909155    1.4468207148
2000-05-05  1.2576420753    1.3659492507
1999-03-30  1.4393018341    0.7417777965
2000-05-05  0.2624037804    0.3860641307
2000-05-05  0.5532216441    0.2618245169
2000-02-08  2.6642931822    2.3815576738
2000-02-09  2.3007578964    2.2626960407
2001-08-14  3.2681270302    2.1611010935
2000-02-08  2.2509121123    2.9481325199
2000-09-20  0.6624503316    0.947935581
2006-09-26  0.6431111805    0.8745333151

通过缩尾化，我的意思是找到 beta_before 的最大值和最小值。该值应替换为同一列中的第二高值或第二低值，而不会丢失观察中的其余细节。例如。在本例中，beta_before 中的最大值为 3.2681270302，应替换为 3.2681270302。 min 和 beta_after 变量将遵循相同的过程。因此，每列只有 2 个值会发生变化，即最高值和最低值，其余保持不变。

有什么建议吗？我在 plyr 中尝试了不同的方法，但最终替换了整个观察结果，这是我不想做的。我想创建 2 个新变量，例如 beta_before_winsorized 和 beta_after_winsorized

最佳答案

我认为winsorizing通常会从有序列表的底部找到值x%(通常是10%、15%或20%)，并用该值替换它下面的所有值。与顶部相同。在这里，您只需选择顶部和底部值，但缩尾处理通常涉及指定要替换的顶部和底部值的百分比。

关于r - 缩尾数据框，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6229824/

文章推荐： java - 完全传递值生成

文章推荐：从图例中删除错误栏(ggplot2)

c# - float 和 double - 尾数 POV？
单精度(32 位):位除法为 like this : 所以我们有 23 位的尾数/有效数。因此我们可以表示 2^23 个数字(通过 23 位):即 8388608 --> 7 位长。但是我读到尾
c - 获取 unsigned int 或 float 的(float 的)尾数 (C)
所以，我正在尝试编写一个函数，以其 (mantissa * 2^exponent) 格式打印给定的 float (n)。我能够得到符号和指数，但不能得到尾数(无论数字是多少，尾数始终等于 0.0000

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

r - 缩尾数据框