python Pandas read_excel : sep parameter available?-6ren

python Pandas read_excel : sep parameter available?

转载作者：行者123 更新时间：2023-12-04 01:56:35

27

4

我正在尝试使用pd.read_excel("C:/...") .

问题是我只得到一列，其中包含以“，”分隔的所有数据。

|---| "Country","Year","Export" |  
|---|---------------------------|  
| 0 | Canada,2017,3002          |  
| 1 | Bulgaria,2016,3960        |  
| 2 | Germany,2015,3818         |

但这不是我想要的格式......我想得到如下表所示的三列。

|---| "Country"    | "Year"   | "Export"   |  
|---|--------------|----------| -----------|  
|1  | Canada       | 2017     |       3002 |  
|2  | Bulgaria     | 2016     |       3960 |  
|3  | Germany      | 2015     |       3818 |

所以我正在寻找 pd.read_csv 中包含的 sep=',' 或 delimiter=',' 参数。我已经完成了 pandas.read_excel 的文档，但还没有找到处理这个问题的参数......

谢谢!

最佳答案

一种选择是将您的 .xlsx 保存为 csv 文件。如果您在文本编辑器中打开它，您应该看到烦人的列保存在引号中，但值用逗号分隔，例如:

"Country,Year,Export",...  
"Canada,2017,3002",...
"Bulgaria,2016,3960",...        
"Germany,2015,3818",...

然后你可以用 pd.read_csv() 读取这个文件它将创建一个名为 'Country,Year,Export' 的列看起来像

  Country,Year,Export
0    Canada,2017,3002
1  Bulgaria,2016,3960
2   Germany,2015,3818

然后，您可以使用 str.split() 将其拆分为单独的列。

df[['Country', 'Year', 'Export']] = pd.DataFrame(df['Country,Year,Export'].str.split(',').tolist())

  Country,Year,Export   Country  Year Export
0    Canada,2017,3002    Canada  2017   3002
1  Bulgaria,2016,3960  Bulgaria  2016   3960
2   Germany,2015,3818   Germany  2015   3818

关于 python Pandas read_excel : sep parameter available?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50091272/

27

4

0

文章推荐： clojure - 没有实现方法 : :spec of protocol: #'schema. 核心/架构

文章推荐： r - Shiny 的应用程序中的多个 group_by

read_excel 所有列文本
这个问题在这里已经有了答案: Specifying Column Types when Importing xlsx Data to R with Package readxl (6 个回答) 2年前
read_excel 不会修剪空格
我正在使用 readxl 包来加载 Excel 文件。默认情况下，它应该去除空白，但它没有这样做。该文件可以直接从下面的链接下载，也可以通过附录B所在的网站下载 http://www2.nation
使用 read_excel 自动删除列名中的所有空格
我的 .xlsx Excel 工作表中的列名称包含空格。如何自动将空格替换为“_”或“.”？我想使用 read_excel 因为我需要在 Excel 工作表中指定一个范围。最佳答案这是一种使用 .
read_excel() 和 lapply()
我有一个 .xlsx 文件有两个工作表，我想使用 readxl 包中的 read_excel 生成两个 Excel 工作表的列表。我用过这段代码 my_work <- lapply(excel_she
使用 read_excel 自动删除列名中的所有空格
我的 .xlsx Excel 工作表中的列名称包含空格。如何自动将空格替换为“_”或“.”？我想使用 read_excel 因为我需要在 Excel 工作表中指定一个范围。最佳答案这是一种使用 .
read_excel 在消息中读取 - 抑制？
我喜欢使用 readxl包裹。但是，我一直将它用作 RMarkdown 文档和一些 read_excel() 文档的一部分。读入文件时的消息在进行分析时很有用，但在尝试呈现分析时则不然。所以问题是，在
python - 当选项卡以空单元格开头时 read_excel
我正在尝试读取包含多个工作表的 Excel 文件，如下所示: sumtech = pd.read_excel('excelfile.xlsx', sheet_name=None) 其中一张工作表具有以
python - Pandas read_excel
我花了几个小时努力如何使用 pd.read_excel 读取 excel 文件，其中路径是网站地址。我发现链接不会直接转到文件，而只是触发下载。有什么简单的方法可以解决吗？部分代码: link_en
来自在线网页链接的 R read_excel 生成一个空数据框
你好，这是我第一次发帖，我正在尝试从在线网页链接 excel 表中获取数据。但是，它适用于页面上的其他链接，但不适用于返回空白数据框的特定链接。 library(readxl) download.f
python - 带有重复标题值的 Pandas read_excel
我有一张我想读入 Pandas 多索引数据框的 excel 表。复杂之处在于 excel 表包含重复的标题值。阅读 pandas 时，将 .x 添加到第二级标题的末尾而不是第一级。有没有办法必须重命名
r - 机器特定的慢 read_excel 读取时间
我使用 read_excel 的读取时间真的很慢在具有特定 xlsm 文件的特定机器上。在 2 台不同的机器上读取相同的 xlsm 文件，我的读取时间为 72 秒与 0.2 秒。较慢的机器实际上具有更
read_excel 'expecting numeric' ..... 值是数字
我没有找到这个问题的答案，所以希望这是在这方面获得帮助的地方。我正在阅读包含在 .zip 文件中的许多 Excel 文件。我拥有的每个 .zip 文件都有大约 40 个我想阅读的 excel 文件。
python - Pandas read_excel 返回对象类型的列
使用以下代码从 Excel 中读取表格，丢弃列标题下的空行，并重命名索引: Energy = pd.read_excel('assets/Energy Indicators.xls', header=
r - 设置 read_excel 来猜测一些列类型
我使用 readxl 包中的 read_excel 读取一个文件，其中我想将其中的 3 列强制转换为文本，其余的我很乐意让 read_excel 猜类型。我可以这样做吗？我尝试使用 col_type
python - Pandas.read_excel 保存后使用旧数据
我有一个冗长的 python 代码与使用 pandas 的 excel 接口(interface)。我的代码打开文件，运行一些 VBA 来更新工作表中的表，保存文件，然后将该表读取到 python 中
r - 如何在R(read_excel)中未读隐藏excel表？
想知道是否有任何方法或技术可以忽略excel工作簿(read_excel)中隐藏的excel_sheet。为什么我要问的是，在许多工作表中隐藏了许多 Excel 文件。到目前为止我已经尝试过的链接
python - Polars read_excel 的日期格式问题
我正在尝试将相当困惑的 Excel 文件读取到 Polars 数据帧，但收到“XlsxValueError:错误:潜在无效的日期格式。”。我认为该问题与某些采用 Excel 数字日期格式的日期列值有
r - 在 read_excel 中保留特定列
我正在将一个 excel 文件导入 R。我只想保留 A 和 C 列而不是 B(列按顺序为 A、B、C)，但以下代码也保留 B 列。如何在不在另一行代码中进行子集化的情况下摆脱 B 列？ df <- r
python - pandas read_excel 同一张纸上的多个表
是否可以使用 pandas 从 Excel 工作表文件中读取多个表？就像是:读取 table1 从 row0 到 row100读取 table2 从第 102 行到第 202 行... 最佳答案我编
excel - 带有超链接的 Pandas read_excel
我有一个 Excel 电子表格，正在将其读入 Pandas DataFrame: df = pd.read_excel("file.xls") 但是，电子表格的其中一列包含具有与其关联的超链接的文本。

首页

博学

6Ren·AI

商城

python Pandas read_excel : sep parameter available?