python - 简化 python/pandas 代码-6ren

python - 简化 python/pandas 代码

转载作者：太空宇宙更新时间：2023-11-03 14:14:05

25

4

我的数据如下所示:

1516268134      49.95   99.982  49.95   0       0       0       0       0       0       01516268134      49.95   99.966  49.95   0       0       0       0       0       0       01516268134      49.95   100.28  49.95   0       0       0       0       0       0       01516268134      49.95   100.01  49.95   0       0       0       0       0       0       01516268134      49.95   100.10  49.95   0       0       0       0       0       0       01516268134      49.95   99.773  49.95   0       0       0       0       0       0       01516268134      49.95   99.246  49.95   0       0       0       0       0       0       01516268134      49.95   144.89  49.95   0       0       0       0       0       0       01516268135      49.95   55.700  49.95   0       0       0       0       0       0       01516268135      49.95   99.441  49.95   0       0       0       0       0       0       0

第2、3、4列是 float ，其余是整数。分隔符是制表符。

我需要取 N 行，并计算最小值/平均值/最大值，例如

1516268134      49.950  55.700  49.950  0       0       0       0       0       0       01516268134      49.950  99.939  49.950  0       0       0       0       0       0       01516268135      49.9500 144.890 49.950  0       0       0       0       0       0       0

同样，第二、第三和第四列是 float ，其余的必须是整数。分隔符仍然是制表符。

代码如下所示:

import sysimport pandasfile=open(sys.argv[2], "w")for data in pandas.read_table(sys.argv[1], delim_whitespace=True, header=None, chunksize=int(sys.argv[3])):  file.write("%d\t%f\t%f\t%f\t%d\t%d\t%d\t%d\t%d\t%d\t%d\n" % (data[0].min(),  data[1].min(),  data[2].min(),  data[3].min(),  data[4].min(),  data[5].min(),  data[6].min(),  data[7].min(),  data[8].min(),  data[9].min(),  data[10].min()))  file.write("%d\t%f\t%f\t%f\t%d\t%d\t%d\t%d\t%d\t%d\t%d\n" % (data[0].mean(), data[1].mean(), data[2].mean(), data[3].mean(), data[4].mean(), data[5].mean(), data[6].mean(), data[7].mean(), data[8].mean(), data[9].mean(), data[10].mean()))  file.write("%d\t%f\t%f\t%f\t%d\t%d\t%d\t%d\t%d\t%d\t%d\n" % (data[0].max(),  data[1].max(),  data[2].max(),  data[3].max(),  data[4].max(),  data[5].max(),  data[6].max(),  data[7].max(),  data[8].max(),  data[9].max(),  data[10].max()))file.close()

我想让代码更短、看起来更好(并且更容易理解和维护)。

尝试将 11x data[X].FUNC() 替换为单个 data.FUNC()，但这给了我错误“TypeError:%d 格式:需要数字，而不是系列”。

我尝试的下一件事是 data.FUNC().convert_objects(convert_numeric=True) 但这给了我同样的错误。

如何更换

data[0].max(),  data[1].max(),  data[2].max(),  data[3].max(),  data[4].max(),  data[5].max(),  data[6].max(),  data[7].max(),  data[8].max(),  data[9].max(),  data[10].max()

用一些简短的内容，并在数据中保留 float/int 格式？

我一直在寻找将 data.FUNC() 转换为 11 个单独数字的解决方案，但失败了。

-帕沃

最佳答案

read_table 中的第一个默认分隔符是 tab，所以应该省略:

然后使用 aggregate或apply在 list 中使用聚合函数:

df = pd.read_table('filename', header=None)

df = df.agg(['min','mean','max'])
#Alternatively:
#df = df.apply(['min','mean','max'])

print (df)
                0      1         2      3    4    5    6    7    8    9    10
min   1.516268e+09  49.95   55.7000  49.95  0.0  0.0  0.0  0.0  0.0  0.0  0.0
mean  1.516268e+09  49.95   99.9388  49.95  0.0  0.0  0.0  0.0  0.0  0.0  0.0
max   1.516268e+09  49.95  144.8900  49.95  0.0  0.0  0.0  0.0  0.0  0.0  0.0

最后如果需要将数据附加到最终文件使用 DataFrame.to_csv与mode='a':

df.to_csv('filename1',index=False, header=None, mode='a', sep='\t')

一起:

file=open(sys.argv[2], "w")

for data in pd.read_table(sys.argv[1], header=None, chunksize=int(sys.argv[3])):
    data = data.agg(['min','max','mean'])
    data.to_csv('filename1',index=False, header=None, mode='a', sep='\t')

关于python - 简化 python/pandas 代码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48318813/

25

4

0

文章推荐： Python h2o 框架到 np 数组 reshape

文章推荐： ssl - Intermediate 签名的证书显示为自签名证书

javascript - 简化 jQuery 代码简化
hello1 hello2 hello3 hello4 hello5 hello6
Clojure 简化
有没有更简短的写法: (apply f (cons a (cons b (cons c d)))) ？谢谢! (我正在编写一些调用其他函数的辅助函数，这种“模式”似乎经常出现
.NETAspire正式发布：简化.NET云原生开发
.NET团队北京时间2024年5月22日已正式发布.NET Aspire ，在博客文章里做了详细的介绍：.NET Aspire 正式发布：简化 .NET 云原生开发 - .NET 博客 (micros
sql - 简化 WHERE (NOT) IN (...) 和 WHERE (NOT) IN (...)
在this dbfiddle demo我有一个 DELETE FROM...WHERE 最后像这样: ...... DELETE FROM data_table WHERE
excel - 简化 if 语句
我有几个 if 语句，如下面的一个。我假设这是一种非常糟糕/长期的编码方式，但不确定我应该做些什么不同的事情。有人有什么建议吗？谢谢 For a = 1 To Leagues If a =
程序修复点的 Coq 简化
有什么类似的战术simpl为 Program Fixpoint ? 特别是，如何证明以下无关紧要的陈述？ Program Fixpoint bla (n:nat) {measure n} := mat
javascript - 简化 .on() 方法中同一父元素的多个子元素的选择器
我使用此代码来跟踪表单上是否有任何更改: $(document).on('input', '.track', function() { var form = $(this); }); 由于这不
JavaScript - 简化/缩短代码
我有以下函数，我想用 for 循环来简化它，但不知道该怎么做。任何帮助都感激不尽。基本上，如果字段值为 0 或 null，则我的总值(字段)应为 0，否则，如果字段值从 1 到 1000，则总值变为
haskell - 简化 do 表示法
我正在尝试对时间字符串执行非常简单的解析 data Time = Time Int Int Int String -- example input: 07:00:00AM timeParser ::
javascript - 简化 setInterval
为了使我的代码更具可读性和更简单，我对这段代码绞尽脑汁: var refresh = setInterval(datumTijd, 1000); function datumTijd() { do
c# - 简化 if 语句
这个问题已经有答案了: Check if a variable is in an ad-hoc list of values (8 个回答) 已关闭 9 年前。只是一个基本的if声明，试图使其更简单
java - 简化 if 语句
我有一个这样的 if 语句 int val = 1; if (val == 0 || val == 1 || val == 2 || ...); 有没有更简单的方法？例如: int val = 1;
java - 简化 if 语句
我有一个程序，其中有一些 if 语句，与我将要向您展示的程序类似。我想知道你们是否可以帮助我以任何方式简化这个方程。我之所以问这个问题，是因为在我的 Notepad++ 中，它持续了 443 列，如果
logic - 简化 if 语句？
是否可以简化这个 if 语句？如果是，答案是什么？ if (type) { if(NdotL >= 0.0) { color
R 简化 shapefile
我有一个包含亚马逊大河的 shapefile。仅 shapefile 就有 37.9 MB，连同属性表高达 42.1 MB。我正在生成所有巴西亚马逊的 PNG 图像，每个 1260x940 像素，sh
java - 简化 printf
System.out.printf("%7s", "a"); System.out.printf("%7s", "b"); System.out.printf("%7s", "c"); S
c - makefile 简化
假设我们有客户端-服务器应用程序，由一个 makefile 编译。服务器使用 libtask 为并行客户端提供服务。客户端使用 ncurses 来处理某些图形。目录树如下所示: ./ --bin/ -
c# - 处置对象(简化)
我在 Mono 密码转换的重新实现中找到了这段代码。我没有修改或简化任何东西 - 这就是它的实际运行方式(有评论如//Dispose unmanaged objects，但实际上什么也没做)。现在
c# - 简化 if if if 以减少代码大小和可读性
我需要一些帮助来简化这个包含数百行的庞大代码，但我真的不知道该怎么做。代码看起来真的很乱，我需要的是返回具有预定义文本颜色的模型。有什么简单的方法吗？我必须多解释一点:- 有一个包含许多型号的手机列
javascript - 简化/优雅此代码？
这里有一些代码可以正常工作，但我认为可以简化/缩短。它基本上是点击一个列表项，获取它的 ID，然后根据 ID 显示/隐藏/删除元素。关于如何使用函数或循环来简化它的建议？ $("#btn_remov

首页

博学

6Ren·AI

商城

python - 简化 python/pandas 代码