- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我正在尝试对数据帧进行列绑定(bind),但遇到了 pandas concat
问题,因为 ignore_index=True
似乎不起作用:
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'D': ['D0', 'D1', 'D2', 'D3']},
index=[0, 2, 3,4])
df2 = pd.DataFrame({'A1': ['A4', 'A5', 'A6', 'A7'],
'C': ['C4', 'C5', 'C6', 'C7'],
'D2': ['D4', 'D5', 'D6', 'D7']},
index=[ 5, 6, 7,3])
df1
# A B D
# 0 A0 B0 D0
# 2 A1 B1 D1
# 3 A2 B2 D2
# 4 A3 B3 D3
df2
# A1 C D2
# 5 A4 C4 D4
# 6 A5 C5 D5
# 7 A6 C6 D6
# 3 A7 C7 D7
dfs = [df1,df2]
df = pd.concat( dfs,axis=1,ignore_index=True)
print df
结果是
0 1 2 3 4 5
0 A0 B0 D0 NaN NaN NaN
2 A1 B1 D1 NaN NaN NaN
3 A2 B2 D2 A7 C7 D7
4 A3 B3 D3 NaN NaN NaN
5 NaN NaN NaN A4 C4 D4
6 NaN NaN NaN A5 C5 D5
7 NaN NaN NaN A6 C6 D6
即使我使用重置索引
df1.reset_index()
df2.reset_index()
然后尝试
pd.concat([df1,df2],axis=1)
它仍然产生相同的结果!
最佳答案
如果我理解正确,这就是你想做的。
import pandas as pd
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'D': ['D0', 'D1', 'D2', 'D3']},
index=[0, 2, 3,4])
df2 = pd.DataFrame({'A1': ['A4', 'A5', 'A6', 'A7'],
'C': ['C4', 'C5', 'C6', 'C7'],
'D2': ['D4', 'D5', 'D6', 'D7']},
index=[ 4, 5, 6 ,7])
df1.reset_index(drop=True, inplace=True)
df2.reset_index(drop=True, inplace=True)
df = pd.concat( [df1, df2], axis=1)
这给出了:
A B D A1 C D2
0 A0 B0 D0 A4 C4 D4
1 A1 B1 D1 A5 C5 D5
2 A2 B2 D2 A6 C6 D6
3 A3 B3 D3 A7 C7 D7
实际上,我希望 df = pd.concat(dfs,axis=1,ignore_index=True)
给出相同的结果。
这是 jreback 的精彩解释:
ignore_index=True
‘ignores’, meaning doesn’t align on the joining axis. it simply pastes them together in the order that they are passed, then reassigns a range for the actual index (e.g.range(len(index))
) so the difference between joining on non-overlapping indexes (assumeaxis=1
in the example), is that withignore_index=False
(the default), you get the concat of the indexes, and withignore_index=True
you get a range.
关于python - Pandas concat ignore_index 不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32801806/
在 pytorch 中 NLLLoss doc ignore_index 的默认值是 -100 而不是通常的 None ,有什么特别的原因吗?似乎任何负值都是等价的。 顺便说一句,我想忽略索引的原因可
我是 Python 新手。我有 2 个数据框,每个数据框有一列。我想将它们连接在一起并根据它们在每个表中各自的位置保留值。 我的代码看起来像这样: huh = pd.DataFrame(columns
我正在尝试对数据帧进行列绑定(bind),但遇到了 pandas concat 问题,因为 ignore_index=True 似乎不起作用: df1 = pd.DataFrame({'A': ['A
我有两个数据框: df1 = value 0 a 1 b 2 c df2 = value 0 d 1 e 我需要跨索引连接它们,但我必须保留第一
加载 CIFAR 100 后,我尝试训练我的神经网络。但我不知道为什么会出现如下所示的越界错误 Optimizing the network with batch size 25 Epoch: 0
我是一名优秀的程序员,十分优秀!