gpt4 book ai didi

linux - 一个txt的统计(出现频率%ecc..)分析

转载 作者:太空狗 更新时间:2023-10-29 12:14:49 26 4
gpt4 key购买 nike

我不知道我应该用什么方法来找出答案:

  • 发生频率
  • 出现在文件中的值

例如我的文件是:

  xxxxx, yyyy , 79
xxxxx, yyyy , 80
xxxxx, yyyy , 79
xxxxx, yyyy , 81
xxxxx, yyyy , 80

我想知道 79 和 80 一样有 40% 的出现率,而 81 有 20% 的出现率。我怎样才能做到这一点? (如果可能,没有 R...)

我需要这些,因为我想使用 gnuplot 绘制直方图。你能告诉我如何使用刚刚计算的值来绘制一个直方图吗?

最佳答案

sort 和 uniq 的某种组合可能会达到目的。你可以开始

cat file  | cut -d ',' -f 3 | sort | uniq --count > file.1

要在 gnuplot 中绘图,请执行

gnuplot
plot [78:82][0:3] "file.1" using 2:1 with boxes

左大括号 [78:82] 设置 xrange,另一个设置 yrange。这可以自动确定,但在此演示案例中,简短查看文件以确定最小/最大值效果很好。

根据您的操作系统和配置,这可能就足够了。您可能还需要使用 set terminalset output。 (启动gnuplot说help,有程序内帮助)

关于linux - 一个txt的统计(出现频率%ecc..)分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29494280/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com