linux - 计算linux文件中的最小值、最大值、计数-6ren

linux - 计算linux文件中的最小值、最大值、计数

转载作者：太空宇宙更新时间：2023-11-04 05:53:55

25

4

我在 Linux 服务器上有一个文件，其中包含如下数据:

我想要一个 shell 脚本或 Linux 命令来查找第 1 列中每个值的最小值、平均值、90%、最大值和计数。

示例:

for a min = 10, avg = 26, 90% = 33, max = 51, and count = 5.

最佳答案

这里的版本甚至有 90% 的百分位使用 gawk。

百分位的定义是由下式给出的维基百科并称为Nearest rank .

轮次函数可以找到 here .

#!/bin/bash

gawk '
function round(x, ival, aval, fraction)
{
    ival = int(x)    # integer part, int() truncates

    # see if fractional part
    if (ival == x)   # no fraction
        return ival   # ensure no decimals

    if (x < 0) {
        aval = -x     # absolute value
        ival = int(aval)
        fraction = aval - ival
        if (fraction >= .5)
            return int(x) - 1   # -2.5 --> -3
        else
            return int(x)       # -2.3 --> -2
    } else {
        fraction = x - ival
        if (fraction >= .5)
            return ival + 1
        else
            return ival
    }
}
# the following block processes all the lines
# and populates counters and values
{
    if($1 in counters) {
        counters[$1]++;
    } else {
        counters[$1] = 1;
    }
    i = counters[$1];
    values[$1, i] = $2;
} END {
    for (c in counters) {
        delete tmp;
        min = values[c, 1];
        max = values[c, 1];
        sum = values[c, 1];
        tmp[1] = values[c, 1];
        for (i = 2; i <= counters[c]; i++) {
            if (values[c, i] < min) min = values[c, i];
            if (values[c, i] > max) max = values[c, i];
            sum += values[c, i];
            tmp[i] = values[c, i];
        }

        # The following 3 lines compute the percentile.
        n = asort(tmp, tmp_sorted);
        idx = round(0.9 * n + 0.5); # Nearest rank definition
        percentile = tmp_sorted[idx];

        # Output of the statistics for this group.  
        printf "for %s min = %d, avg = %f, 90 = %d,max = %d, count = %d\n", c, min, (sum / counters[c]), percentile, max, counters[c]; 
    }
}'

运行执行:

./stats.sh < input.txt

我假设上述脚本名为 stats.sh 并且您的输入保存在 input.txt 中。

输出为:

for a min = 10, avg = 26.600000, 90 = 51,max = 51, count = 5
for b min = 47, avg = 49.000000, 90 = 51,max = 51, count = 2
for c min = 33, avg = 33.000000, 90 = 33,max = 33, count = 1

解释如下:

counters是一个关联数组，键是第1列的值该值是在每个输入中找到的值的数量第 1 列中的值。

values 是二维的(value_in_column_one, counter_per_value)数组，将所有值按第一列中的值分组。

在脚本末尾，最外层循环遍历所有值在第 1 列中找到。最里面的 for 循环分析属于的所有值为第 1 列中的特定值，并计算所有静态数据。

关于linux - 计算linux文件中的最小值、最大值、计数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18462714/

25

4

0

文章推荐： C - 取消引用 void 指针

文章推荐： html - CSS:它的背景颜色的边距和填充从哪里来？

文章推荐： c - 在 C 中定义弹性/柔性结构

Android 位置、经度(最小值、最大值)、纬度(最小值、最大值)
我在使用 Android 时遇到了一点问题。我有我的 GPS 位置，明确的经纬度，以及以米为单位的搜索射线(例如 100 米)，可以吗？想象一下我在射线形成的圆心的位置，我会知道如何在 Andro
python 二元二次函数最小值
深夜的编程之旅这是一个深夜，街头灯光昏暗，大部分人都已陷入梦乡。但对于我来说，这却是一个灵感迸发的时刻。窗外的星空仿佛在诉说着某种宇宙的密码，而键盘下的代码则是我解密这个宇宙的工具。一个突如其来的
arrays - 如何在结构数组中找到最大/最小值
我将数据集结构定义为 struct Dataset: Hashable { var x: Double var y: Double } 然后是数组 var dataset: [Data
excel - 在不使用数组的情况下查找最大值/最小值
我在 Excel 文件中有一个摘要选项卡，需要查看应计选项卡才能找到 Max和 Min .我遇到的问题是有许多不同的位置/商品组合，我需要找到 Max和 Min基于位置/商品组合。位置和商品位于两个单
范围子集的 excel 最小值
我有一个 Excel 表，其中包含两列感兴趣的年份和捐款。年份值为 2008,2009,2010 等... 我想获得 2009 年所有捐款中的最低金额。我试过了 MIN(IF(Year="2009",
r - 从没有循环的数据帧列表中获取最大/最小值
到现在为止，我刚刚找到了为列表中多个数据帧中的列获取最大值的解决方案。我已经将数据帧 df1, df2, df3, ..., dfn 存储在列表 dfList 中，我想获取列 df_ 的最大值$a
R:查找数据框中列列表的最大值/最小值
假设我有一个列名列表作为向量: vec=c("C1" , "C2" ,"C3"). 我知道这些列名来自数据框 df: df: C1 C2 C3 C4 C5 1 2 3 4 5 1 4
javascript - JS中大数组的最大值/最小值
我需要计算大数组的最小值/最大值。我知道Math.max.apply() ，但在大型数组上，它会因堆栈溢出异常而失败。有什么简单的解决方案吗？最佳答案使用 sort() 对数组进行排序方法它使用快
Django - 有没有一种方法可以在不使用迭代器的情况下从模型中查找字段的最大/最小值？
例如，我有一个像这样的模型: class Record(models.Model): name = CharField(...) price = IntegerField(...)
android - 音轨setVolume-最小值
我正在编写一个用于测试听力的简单应用，并且正在使用Audiotrack生成纯音。因为它是用于测试听力的应用程序，所以我使用非常低的音量来播放这些音调。要设置音量，我使用音轨的 setVolume(f
excel - 水平方向数据的条件最大/最小值
Example data set 对，上面是我的数据集子段图像的链接。它以 3 列为一组，第一个是浓度，第二个是限定值，最后一个是 MDL - 并持续最多 95 个 sample (因此总共 285
python - 计算python中每n行数据帧的最大值/最小值
我想计算 df 的每 n 行的最小值/最大值，比如 10，但是使用 df.rolling(10).max() 给出第 0-9、1-10、2-11 行的值等。我想要 0-9、10-19、20-29 等
java - 如何在java中获取二维数组列表的最大值/最小值
我被问到了关于 c# 的同样问题 here我发现通过使用 linq 你可以轻松地做到这一点。但是既然 java 中的 linq 没有其他选择，我该如何简单地做到这一点呢？最佳答案如果您想要类似于
java - 在Java中查找字符串数组中字符串元素的最大/最小值
我曾经使用过数组，并且知道如何对使用数值(double 和 int)的数组进行排序，但我必须使用字符串数组制作相同的应用程序。我的教授不允许我发挥“创造力”，也不允许我与其他可能有助于完成这项工作的静
Prolog:通过回溯获得最大/最小值？
我想知道通过这样的回溯获得某些事实的最大值(最年长的人)是否是个好主意: data(MaxID, MaxName, MaxAge), \+ (data(ID, Name, Age), ID \= Ma
python - 计算python中每n行数据帧的最大值/最小值
我想计算 df 的每 n 行的最小值/最大值，比如 10，但是使用 df.rolling(10).max() 给出第 0-9、1-10、2-11 行的值等。我想要 0-9、10-19、20-29 等
r - 找到一对列中的最大值/最小值
我的数据如下所示: df <- tribble( ~A, ~B, 0.2, 0.1, 0.2, 0.3, 0.5, 0.1, 0.7, 0.9,
SQL 查询以查找基于日期的数据的本地最大值、最小值
我有以下数据集 Date Category 2014-01-01 A 2014-01-02 A 2014-01-03 A 2014-01-04
python - 查找各个列的最大/最小值
我是使用 Python 进行数据分析的初学者，并且坚持以下几点: 我想使用广播/矢量化方法从各个列 (pandas.dataframe) 中找到最大值(value)。我的数据框的快照如下: 最佳答案
C 最小值/最大值函数
C99 中是否有一个标准函数来使用给定的比较函数获取给定数组中的最小/最大元素。类似: void* get_min(void* start,size_t size,size_t elementSiz

首页

博学

6Ren·AI

商城

linux - 计算linux文件中的最小值、最大值、计数