gpt4 book ai didi

python - 如何删除python中单元格中包含 'Unnamed'的行?

转载 作者:行者123 更新时间:2023-12-04 13:00:16 30 4
gpt4 key购买 nike

我正在尝试使用 Pandas 读取 excel 文件。我只想从 excel 文件中读取相关数据,即删除包含“nan”值的行/列。我遇到了数据框的第一行包含“未命名”值的问题。
我的标题从哪一行开始从来没有固定过,因此我避免使用跳过和标题。

在使用下面提到的命令时,它从数据帧中删除了几乎所有数据,因为它将 Unnamed 视为 header 。

df = df.loc[:, ~df.columns.str.contains('^Unnamed')]

我使用以下命令来清理我的数据:
data = pd.read_excel("text.xlsx", sheet_name=1,index=False)
print(data)
BINS 2018-RUI: Red Roof Inn Portfolio Unnamed: 1 Unnamed: 2 Unnamed: 3 Unnamed: 5
0 NaN NaN NaN NaN NaN NaN
1 NaN NaN NaN NaN NaN NaN
2 NaN NaN NaN NaN NaN NaN
3 No. Property \nID Property Name Street Address
4 1.001 10228 Red Roof Plus 777 Airport Boulevard
5 1.002 10150 Red Roof Plus1 15 Meadowlands Parkway
6 1.003 10304 Red Roof Inn Boulevard Seattle
data1 = data.dropna(axis = 0, how = 'all', thresh=3)
data2 = data1.dropna(axis = 1, how = 'all')
print(data2)

BINS 2018-RUI: Red Roof Inn Portfolio Unnamed: 1 Unnamed: 2 Unnamed: 3 Unnamed: 5
3 No. Property \nID Property Name Street Address
4 1.001 10228 Red Roof Plus 777 Airport Boulevard
5 1.002 10150 Red Roof Plus1 15 Meadowlands Parkway
6 1.003 10304 Red Roof Inn Boulevard Seattle

预期输出:
3   No. Property \nID   Property Name       Street Address  
4 1.001 10228 Red Roof Plus 777 Airport Boulevard
5 1.002 10150 Red Roof Plus1 15 Meadowlands Parkway
6 1.003 10304 Red Roof Inn Boulevard Seattle

我不希望在单元格上写有未命名的第一行。
(这是一小部分数据,实际数据有 100 行 100 列)

最佳答案

鉴于您不知道要跳过多少行,像您一样删除所有 NA 值就可以了。

缺少的步骤是将第一行(notna)设置为标题:

data.columns = data.iloc[0]

然后从数据集中删除该行:
data = data.iloc[1:,].reindex()

关于python - 如何删除python中单元格中包含 'Unnamed'的行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58787776/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com