- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我的数据如下所示:
1516268134 49.95 99.982 49.95 0 0 0 0 0 0 01516268134 49.95 99.966 49.95 0 0 0 0 0 0 01516268134 49.95 100.28 49.95 0 0 0 0 0 0 01516268134 49.95 100.01 49.95 0 0 0 0 0 0 01516268134 49.95 100.10 49.95 0 0 0 0 0 0 01516268134 49.95 99.773 49.95 0 0 0 0 0 0 01516268134 49.95 99.246 49.95 0 0 0 0 0 0 01516268134 49.95 144.89 49.95 0 0 0 0 0 0 01516268135 49.95 55.700 49.95 0 0 0 0 0 0 01516268135 49.95 99.441 49.95 0 0 0 0 0 0 0
第2、3、4列是 float ,其余是整数。分隔符是制表符。
我需要取 N 行,并计算最小值/平均值/最大值,例如
1516268134 49.950 55.700 49.950 0 0 0 0 0 0 01516268134 49.950 99.939 49.950 0 0 0 0 0 0 01516268135 49.9500 144.890 49.950 0 0 0 0 0 0 0
同样,第二、第三和第四列是 float ,其余的必须是整数。分隔符仍然是制表符。
代码如下所示:
import sysimport pandasfile=open(sys.argv[2], "w")for data in pandas.read_table(sys.argv[1], delim_whitespace=True, header=None, chunksize=int(sys.argv[3])): file.write("%d\t%f\t%f\t%f\t%d\t%d\t%d\t%d\t%d\t%d\t%d\n" % (data[0].min(), data[1].min(), data[2].min(), data[3].min(), data[4].min(), data[5].min(), data[6].min(), data[7].min(), data[8].min(), data[9].min(), data[10].min())) file.write("%d\t%f\t%f\t%f\t%d\t%d\t%d\t%d\t%d\t%d\t%d\n" % (data[0].mean(), data[1].mean(), data[2].mean(), data[3].mean(), data[4].mean(), data[5].mean(), data[6].mean(), data[7].mean(), data[8].mean(), data[9].mean(), data[10].mean())) file.write("%d\t%f\t%f\t%f\t%d\t%d\t%d\t%d\t%d\t%d\t%d\n" % (data[0].max(), data[1].max(), data[2].max(), data[3].max(), data[4].max(), data[5].max(), data[6].max(), data[7].max(), data[8].max(), data[9].max(), data[10].max()))file.close()
我想让代码更短、看起来更好(并且更容易理解和维护)。
尝试将 11x data[X].FUNC() 替换为单个 data.FUNC(),但这给了我错误“TypeError:%d 格式:需要数字,而不是系列”。
我尝试的下一件事是 data.FUNC().convert_objects(convert_numeric=True) 但这给了我同样的错误。
如何更换
data[0].max(), data[1].max(), data[2].max(), data[3].max(), data[4].max(), data[5].max(), data[6].max(), data[7].max(), data[8].max(), data[9].max(), data[10].max()
用一些简短的内容,并在数据中保留 float/int 格式?
我一直在寻找将 data.FUNC() 转换为 11 个单独数字的解决方案,但失败了。
-帕沃
最佳答案
read_table
中的第一个默认分隔符是 tab
,所以应该省略:
然后使用 aggregate
或apply
在 list
中使用聚合函数:
df = pd.read_table('filename', header=None)
df = df.agg(['min','mean','max'])
#Alternatively:
#df = df.apply(['min','mean','max'])
print (df)
0 1 2 3 4 5 6 7 8 9 10
min 1.516268e+09 49.95 55.7000 49.95 0.0 0.0 0.0 0.0 0.0 0.0 0.0
mean 1.516268e+09 49.95 99.9388 49.95 0.0 0.0 0.0 0.0 0.0 0.0 0.0
max 1.516268e+09 49.95 144.8900 49.95 0.0 0.0 0.0 0.0 0.0 0.0 0.0
最后如果需要将数据附加到最终文件使用 DataFrame.to_csv
与mode='a'
:
df.to_csv('filename1',index=False, header=None, mode='a', sep='\t')
一起:
file=open(sys.argv[2], "w")
for data in pd.read_table(sys.argv[1], header=None, chunksize=int(sys.argv[3])):
data = data.agg(['min','max','mean'])
data.to_csv('filename1',index=False, header=None, mode='a', sep='\t')
关于python - 简化 python/pandas 代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48318813/
hello1 hello2 hello3 hello4 hello5 hello6
有没有更简短的写法: (apply f (cons a (cons b (cons c d)))) ? 谢谢! (我正在编写一些调用其他函数的辅助函数,这种“模式”似乎经常出现
.NET团队北京时间2024年5月22日已正式发布.NET Aspire ,在博客文章里做了详细的介绍:.NET Aspire 正式发布:简化 .NET 云原生开发 - .NET 博客 (micros
在this dbfiddle demo我有一个 DELETE FROM...WHERE 最后像这样: ...... DELETE FROM data_table WHERE
我有几个 if 语句,如下面的一个。我假设这是一种非常糟糕/长期的编码方式,但不确定我应该做些什么不同的事情。有人有什么建议吗? 谢谢 For a = 1 To Leagues If a =
有什么类似的战术simpl为 Program Fixpoint ? 特别是,如何证明以下无关紧要的陈述? Program Fixpoint bla (n:nat) {measure n} := mat
我使用此代码来跟踪表单上是否有任何更改: $(document).on('input', '.track', function() { var form = $(this); }); 由于这不
我有以下函数,我想用 for 循环来简化它,但不知道该怎么做。任何帮助都感激不尽。基本上,如果字段值为 0 或 null,则我的总值(字段)应为 0,否则,如果字段值从 1 到 1000,则总值变为
我正在尝试对时间字符串执行非常简单的解析 data Time = Time Int Int Int String -- example input: 07:00:00AM timeParser ::
为了使我的代码更具可读性和更简单,我对这段代码绞尽脑汁: var refresh = setInterval(datumTijd, 1000); function datumTijd() { do
这个问题已经有答案了: Check if a variable is in an ad-hoc list of values (8 个回答) 已关闭 9 年前。 只是一个基本的if声明,试图使其更简单
我有一个这样的 if 语句 int val = 1; if (val == 0 || val == 1 || val == 2 || ...); 有没有更简单的方法?例如: int val = 1;
我有一个程序,其中有一些 if 语句,与我将要向您展示的程序类似。我想知道你们是否可以帮助我以任何方式简化这个方程。我之所以问这个问题,是因为在我的 Notepad++ 中,它持续了 443 列,如果
是否可以简化这个 if 语句? 如果是,答案是什么? if (type) { if(NdotL >= 0.0) { color
我有一个包含亚马逊大河的 shapefile。仅 shapefile 就有 37.9 MB,连同属性表高达 42.1 MB。我正在生成所有巴西亚马逊的 PNG 图像,每个 1260x940 像素,sh
System.out.printf("%7s", "a"); System.out.printf("%7s", "b"); System.out.printf("%7s", "c"); S
假设我们有客户端-服务器应用程序,由一个 makefile 编译。服务器使用 libtask 为并行客户端提供服务。客户端使用 ncurses 来处理某些图形。目录树如下所示: ./ --bin/ -
我在 Mono 密码转换的重新实现中找到了这段代码。 我没有修改或简化任何东西 - 这就是它的实际运行方式(有评论如//Dispose unmanaged objects,但实际上什么也没做)。 现在
我需要一些帮助来简化这个包含数百行的庞大代码,但我真的不知道该怎么做。代码看起来真的很乱,我需要的是返回具有预定义文本颜色的模型。有什么简单的方法吗? 我必须多解释一点:- 有一个包含许多型号的手机列
这里有一些代码可以正常工作,但我认为可以简化/缩短。它基本上是点击一个列表项,获取它的 ID,然后根据 ID 显示/隐藏/删除元素。 关于如何使用函数或循环来简化它的建议? $("#btn_remov
我是一名优秀的程序员,十分优秀!