python - 在python pandas中动态跳过excel的顶部空白行-6ren

python - 在python pandas中动态跳过excel的顶部空白行

转载作者：行者123 更新时间：2023-12-04 19:47:11

28

4

我正在使用 python 中的 pandas 读取多张 excel 文件。我有三种情况

一些工作表有第 1 行的数据

osht=pd.DataFrame(filename+sheetname)

delimited table Example: 
Country;Company;Product
US;ABC;XYZ
US;ABD;XYY

有些表前有 n 行空白，有些表有摘要我知道使用 skip_blank 我可以摆脱顶部空白行，但顶部空白行的数量在本质上并不固定，可能是 3 或 4 或 8

delimited table Example: 
;;
;;
;;
Country;Company;Product
US;ABC;XYZ
US;ABD;XYY

第 1 列中的表格我正在尝试阅读所有这些表格，但不确定如何阅读- 有什么方法可以从第 3 行总结结束，第 4 行是我的表格标题，第一列标题是“国家/地区”

delimited table Example: 

Product summary table for East region;;
Date: 1st Sep, 2016;;
;;
Country;Company;Product
US;ABC;XYZ
US;ABD;XYY

最佳答案

我会提出以下算法:

阅读整张表格
将不包含缺失值的第一行视为标题
将所有行放在标题上方

这段代码对我来说没问题:

import pandas as pd
for sheet in range(3):
    raw_data = pd.read_excel('blank_rows.xlsx', sheetname=sheet, header=None)
    print(raw_data)
    # looking for the header row
    for i, row in raw_data.iterrows():
        if row.notnull().all():
            data = raw_data.iloc[(i+1):].reset_index(drop=True)
            data.columns = list(raw_data.iloc[i])
            break
    # transforming columns to numeric where possible
    for c in data.columns:
        data[c] = pd.to_numeric(data[c], errors='ignore')
    print(data)

它使用 this toy data sample ，根据你的例子。来自原始数据帧

         0        1        2
0  Country  Company  Product
1       US      ABC      XYZ
2       US      ABD      XYY

         0        1        2
0      NaN      NaN      NaN
1      NaN      NaN      NaN
2      NaN      NaN      NaN
3  Country  Company  Product
4       US      ABC      XYZ
5       US      ABD      XYY

                                       0        1        2
0  Product summary table for East region      NaN      NaN
1                    Date: 1st Sep, 2016      NaN      NaN
2                                    NaN      NaN      NaN
3                                Country  Company  Product
4                                     US      ABC      XYZ
5                                     US      ABD      XYY

脚本生成相同的表

  Country Company Product
0      US     ABC     XYZ
1      US     ABD     XYY

关于python - 在python pandas中动态跳过excel的顶部空白行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47039309/

28

4

0

文章推荐： php - 在 PHPSpreadsheet 中迭代时如何获取单元格坐标？

文章推荐： c# - 在 C# 中设置列宽 (Interop.Excel)

linq-to-excel - LinqToExcel 空白行
我正在使用 LinqToExcel 轻松地将 Excel 数据导入 SQL Server。 var fileName = ConfigurationManager.AppSetting
wpf - 在数据绑定(bind)流文档中插入分隔符(空白行)
在我的 MVVM WPF 应用程序中，我使用的是数据绑定(bind)流文档。我使用了 here 描述的技术能够将我的数据绑定(bind)到流文档。我的流文档绑定(bind)到我的 View 模型中的
c# - WPF DataGrid 添加行但不添加数据(空白行)
好吧，这很难解释。场景: 我有一个 DataGrid 定义如下: 它有两个 header ，我需要添加数据，我做了很多研究建议使用 Obs
vb.net - 如果用户单击该行并将焦点从该行移开，则重置 DataGridView 空白行
如果用户单击 DataGridView 底部的空白行并将焦点从 DataGridView 移开，则现在单击的行将处于指示对该行进行更改的状态。是否可以告诉 DataGridView 取消将此行标记为
java - 我怎样才能使用apachi POI java从Excel中获取不包括空白空间(空白行)的总行数？
我必须迭代行并将其添加到列表中，但我得到的总行数是 Excel 工作表中存在的总行数，即 1001 行，但我只有 3 行，包括标题，我必须停止使用行号的大小进行循环。我的代码是 Sheet
python - 如何使用 Python 删除/去除我的 csv 文件中的白色/空白行？
我有一个 csv 文件，其中包含必须从中删除的信息(通过删除相应的列来完成)，我得到的输出是我所期望的，除了每行之间还给我空白行。我怎样才能摆脱那些？ (我目前没有pandas，所以如果有解决这个问题

首页

博学

6Ren·AI

商城

python - 在python pandas中动态跳过excel的顶部空白行