gpt4 book ai didi

python - 合并2个以上的python pandas数据框

转载 作者:行者123 更新时间:2023-12-01 03:59:22 24 4
gpt4 key购买 nike

我有一些像这样的数据框

num  a    --  num  b    --  num  c    --   num  d
101 0 101 1 102 0 101 1
102 1 103 1 103 0 102 0
103 0 104 0 104 1 103 1
104 0 105 0 105 1 104 1
105 1 107 1 106 1 106 0
106 1 108 1 107 1 107 0

我将它们放在一个名为“frames”的数组中。我想做一些类似 pd.concat(frames) 的事情并得到结果

num   a   b   c   d
101 0 1 Nan 1
102 1 Nan 0 0
103 0 1 0 1
104 0 0 1 1
105 1 0 1 Nan
106 1 Nan 1 0
107 Nan 1 1 0
108 Nan 1 Nan Nan

但我认为我应该使用 pd.mergenum 设置为列上的联接。使用 merge 我认为我只能合并 2 个数据框,我应该在循环中使用它来合并所有数据框吗?或者我可以用 concat 来做到这一点还是有另一种(更好的)方法?

最佳答案

更新:

dfs = []

data = """\
num a
101 0
102 1
103 0
104 0
105 1
106 1
"""
dfs.append(pd.read_csv(io.StringIO(data), delim_whitespace=True))

data = """\
num b
101 1
103 1
104 0
105 0
107 1
108 1
"""
dfs.append(pd.read_csv(io.StringIO(data), delim_whitespace=True))

data = """\
num c
102 0
103 0
104 1
105 1
106 1
107 1
"""
dfs.append(pd.read_csv(io.StringIO(data), delim_whitespace=True))

data = """\
num d
101 1
102 0
103 1
104 1
106 0
107 0
"""
dfs.append(pd.read_csv(io.StringIO(data), delim_whitespace=True))

让我们将 num 设置为索引:

for i in range(len(dfs)):
dfs[i].set_index('num', inplace=True)


df = pd.concat(dfs, axis=1)

产量:

In [116]: df
Out[116]:
a b c d
num
101 0.0 1.0 NaN 1.0
102 1.0 NaN 0.0 0.0
103 0.0 1.0 0.0 1.0
104 0.0 0.0 1.0 1.0
105 1.0 0.0 1.0 NaN
106 1.0 NaN 1.0 0.0
107 NaN 1.0 1.0 0.0
108 NaN 1.0 NaN NaN

旧答案:

尝试 pd.concat(..., axis=1):

pd.concat(frames, axis=1)

它会通过索引水平连接您的帧,因此您可能需要事先设置适当的索引

关于python - 合并2个以上的python pandas数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36875978/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com