gpt4 book ai didi

python - 使用新添加的列 reshape 数据框

转载 作者:太空宇宙 更新时间:2023-11-03 11:18:23 31 4
gpt4 key购买 nike

columns = ['a', "b","cin",'cout', 'din', 'dout']
rows = [[1 , 1, 3, 4, 2, 3], [2,3,3,1, 8 , 4], [3,1,3,1, 2, 1]]
dff1 = pd.DataFrame(rows, columns=columns)

结果

enter image description here

如何将输出设为 6 行,其中 Cin、Cout 和 din、dout 分别作为带有 a 和 b 的 2 行?还添加了输入/输出列。

一般来说,我需要操纵上面的数据框来带来下面的附件

enter image description here

最佳答案

你可以使用lreshape:

df = pd.lreshape(dff, {'c':['c1','c2'], 'd':['d1','d2']})
print (df)
a b c d
0 1 1 3 2
1 2 3 3 8
2 3 1 3 2
3 1 1 4 3
4 2 3 1 4
5 3 1 1 1

wide_to_long :

dff = dff.reset_index()
a = (pd.wide_to_long(dff, stubnames=['c', 'd'], i='index', j='B')
.reset_index(drop=True)
.reindex(columns=['a','b','c', 'd']))
print (a)
a b c d
0 1 1 3 2
1 2 3 3 8
2 3 1 3 2
3 1 1 4 3
4 2 3 1 4
5 3 1 1 1

编辑:如果还需要列,请使用 melt , extract , assign最后sort_values :

a = dff1.melt(id_vars=['a','b'],value_vars=['cin','cout'],value_name = 'c',var_name='in/out')
b = dff1.melt(id_vars=['a','b'],value_vars=['din','dout'],value_name = 'd',var_name='in/out')
a['in/out'] = a['in/out'].str.extract('(in|out)', expand=False)
b['in/out'] = b['in/out'].str.extract('(in|out)', expand=False)
print (a)
a b in/out c
0 1 1 in 3
1 2 3 in 3
2 3 1 in 3
3 1 1 out 4
4 2 3 out 1
5 3 1 out 1

print (b)
a b in/out d
0 1 1 in 2
1 2 3 in 8
2 3 1 in 2
3 1 1 out 3
4 2 3 out 4
5 3 1 out 1

c = a.assign(d=b['d']).sort_values(['a','b'])
#same as
#c = pd.merge(a,b).sort_values(['a','b'])

print (c)
a b in/out c d
0 1 1 in 3 2
3 1 1 out 4 3
1 2 3 in 3 8
4 2 3 out 1 4
2 3 1 in 3 2
5 3 1 out 1 1

pandas 0.15.0 重写的解决方案:

a=pd.melt(dff1,id_vars=['a','b'],value_vars=['cin','cout'],value_name='c',var_name='in/out') 
b=pd.melt(dff1,id_vars=['a','b'],value_vars=['din','dout'],value_name='d',var_name='in/out')
a['in/out'] = a['in/out'].str.extract('(in|out)')
b['in/out'] = b['in/out'].str.extract('(in|out)')
c = pd.merge(a,b).sort_values(['a','b'])

wen 删除的答案中的另一个解决方案 - 是必要的 replace字符串到数字,然后使用 wide_to_long , 最后 map返回:

#define columns
L = ['in','out']
d = dict(enumerate(L))
d1 = {v: str(k) for k, v in d.items()}
print (d)
{0: 'in', 1: 'out'}

print (d1)
{'out': '1', 'in': '0'}

dff1.columns = dff1.columns.to_series().replace(d1,regex=True)
a = pd.wide_to_long(dff1, stubnames=['c', 'd'], j='in/out', i=['a','b']).reset_index()
a['in/out'] = a['in/out'].astype(int).map(d)
a = a[['a','b','c','d','in/out']]
print (a)
a b c d in/out
0 1 1 3 2 in
1 1 1 4 3 out
2 2 3 3 8 in
3 2 3 1 4 out
4 3 1 3 2 in
5 3 1 1 1 out

编辑:

对于还原进程使用:

df = df.set_index(['a', 'b', 'in/out']).unstack()
df.columns = df.columns.map(''.join)
df = df.reset_index()
print (df)
a b cin cout din dout
0 1 1 3 4 2 3
1 2 3 3 1 8 4
2 3 1 3 1 2 1

关于python - 使用新添加的列 reshape 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48189698/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com