gpt4 book ai didi

Python计算不同数据帧的中值

转载 作者:太空宇宙 更新时间:2023-11-04 02:29:08 24 4
gpt4 key购买 nike

我有一个包含不同子文件夹的文件夹,每个子文件夹包含一个表 merged.txt 具有相同的框架,但标题名称有一些差异,如下所示:

../a/merged.txt:

stat,a_a,b_a,c_a,d_a
std,1,2,3,4

../b/merged.txt:

stat,a_b,b_b,c_b,d_b
std,2,3,4,5

我想输出一个表格,其中包含标题和行名称之外的每一行的中值,如下所示:

stat,a,b,c,d
std,1.5,2.5,3.5,4.5

有人知道怎么做吗?谢谢

最佳答案

这是使用 pandasnumpy 的一种方法。

import pandas as pd
from io import StringIO

str1 = StringIO("""
stat,a_a,b_a,c_a,d_a
std,1,2,3,4""")

str2 = StringIO("""
stat,a_b,b_b,c_b,d_b
std,2,3,4,5""")

# replace str1 & str2 with 'file1.csv' and 'file2.csv'
df1 = pd.read_csv(str1)
df2 = pd.read_csv(str2)

df = pd.DataFrame(np.median([df1.iloc[:, 1:].values, df2.iloc[:, 1:].values], axis=0),
columns=list('abcd')).assign(stat=df1['stat'])

df = df[['stat', 'a', 'b', 'c', 'd']]

df.to_csv('file.csv', index=False)

# stat a b c d
# 0 std 1.5 2.5 3.5 4.5

关于Python计算不同数据帧的中值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49651170/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com