python - 使用 pandas 将多个 xlsm 文件自动转换为多个 csv 文件

转载作者：太空宇宙更新时间：2023-11-03 21:29:51

26

4

我有 300 个原始数据(.xlsm)，想要提取有用的数据并将它们转换为 csv 文件作为后续神经网络的输入，现在我尝试用 10 个数据来实现它们作为示例，我已经成功提取了信息我需要，但我不知道如何将它们转换为同名的 csv 文件，对于单个数据我们可以使用 df.to_csv，但是对于所有数据怎么样？与 for 函数？

    import glob
    import pandas as pd
    import numpy as np
    import csv
    import os

    excel_files = glob.glob('../../Versuch/Versuche/RohBeispiel/*.xlsm') 
    directory = '/Beispiel'
    for files in excel_files:
        data = pd.read_excel(files)
        # getting the list of rows and columns you need
        list_of_dfs = pd.DataFrame(data.values[0:600:,12:26], 
                                   columns=data.columns[12:26]).drop(['Sauberkeit', 'Temparatur'], axis=1)
        # converting pandas dataframe columns to numeric: string into float
        cols = ['KonzA', 'KonzB', 'KonzC', 'TempA', 
                'TempB', 'TempC', 'Modul1', 'Modul2', 
                'Modul3', 'Modul4', 'Modul5', 'Modul6']
        list_of_dfs[cols] = list_of_dfs[cols].apply(pd.to_numeric, errors='coerce', axis=1)
        # Filling down from a column through missing data
        for fec in list_of_dfs[cols]:
            list_of_dfs[fec].fillna(method='ffill', inplace=True)       

        csvfilename = files.split('/')[-1].split('.')[0] + '.csv'
        newtempfile = os.path.join(directory,csvfilename)
        print(newtempfile)
        print(list_of_dfs.head(2))

问题已解决。

folder_name = 'Beispiel'
csvfilename = files.split('/')[-1].split('.')[0] + '.csv'  # change into csv files
newtempfile = os.path.join(folder_name, csvfilename)

# Verify if directory exists
if not os.path.exists(folder_name):
    os.makedirs(folder_name)  # If not, create it

print(newtempfile)
list_of_dfs.to_csv(newtempfile, index=False)

最佳答案

最简单的方法是从 Excel 中获取文件名，然后使用 os.path.join() 方法将其保存到您想要的目录。

directory = "C:/Test"
for files in excel_files:
    csvfilename = (os.path.basename(file)[-1]).replace('.xlsm','.csv') 
    newtempfile=os.path.join(directory,csvfilename)

由于您已经有了要插入 csv 文件的 excel df，只需将上述代码添加到循环中并将输出 csv 文件更改为“newtempfile”即可。

df.to_csv(newtempfile, 'Beispel/data{0}.csv'.format(idx))

希望这有帮助。 :)

更新的代码:

    cols = ['KonzA', 'KonzB', 'KonzC', 'TempA', 
                    'TempB', 'TempC', 'Modul1', 'Modul2', 
                        'Modul3', 'Modul4', 'Modul5', 'Modul6']
    excel_files = glob.glob('../../Versuch/Versuche/RohBeispiel/*.xlsm')
        for file in excel_files:
            data = pd.read_excel(file, columns = cols) # import only the columns you need to the dataframe
            csvfilename = (os.path.basename(files)[-1]).replace('.xlsm','.csv') 
            newtempfile=os.path.join(directory,csvfilename)
            
            # converting pandas dataframe columns to numeric: string into float
            data[cols] = data[cols].apply(pd.to_numeric, errors='coerce', axis=1)
            data[cols].fillna(method='ffill', inplace=True)
            data.to_csv(newtempfile).format(idx)

关于python - 使用 pandas 将多个 xlsm 文件自动转换为多个 csv 文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53590379/

26

4

0

文章推荐： python - OpenCV:从 RGB 图像中提取颜色 channel

文章推荐： javascript - Bootstrap 多个下拉菜单更改相应的按钮文本

文章推荐： html - 你如何通过覆盖它从 Bootstrap 中完全删除样式

文章推荐： html - CSS 如何在悬停时为不透明度 0 的过渡设置动画

xlsm - .xlsm 文件上的感叹号
我准备了一个带有 Visual Basic 代码的 excel 文件。它以 .xlsm 扩展名保存。现在excel图标出现了令人恼火的感叹号。我可以从图标中删除那个感叹号吗？最佳答案使用 .xl
python - 如何从 xlsm 文件复制宏并将其插入到另一个 xlsm 文件中？
我正在尝试从 xlsm 文件复制宏并将其粘贴到新的 xlsm 文件中。我正在研究 win32com 和 xlwings，但没有找到任何有用的东西。非常感谢解决问题的提示! 最佳答案安装 Python
xlsm - 使用exceljs包npm读写xlsm文件
我有一个 xlsm 文件，其中已经有很少的数据，需要在自动化过程中写入一些数据并创建一个新的 xlsm 文件。使用以下代码创建文件，但它已损坏且无法打开。文件大小减少，例如从 8kb 到 7kb。不确
VBA SaveAs 保存为文件类型而不是 .xlsm
当用户打开此工作簿时，我想强制他们立即将文件另存为新文件。对话框打开，但它只会让您将其另存为“所有文件”。 Dim Workbook_Orig As Variant Workbook_Orig
vba - 引用并打开外部 xlsm 库时强制退出
我有三个文件，一个是app.xlsm ，另一个是lib.xlsm , 而 app.xlsm使用 lib.xlsm作为引用(在工具 -> 引用中指定)。第三个，third.xlsm有以下代码: Priv
excel - 无法刷新对外部 xlsm 文件的引用
我有两个 Excel 文件，父文件和子文件，其中子文件包含父函数使用的函数库。出于版本控制的目的，我将它们保存在同一个文件夹中，并在完全相同的位置复制和重命名该文件夹以跟踪我的版本。我还希望动态更新引
excel - 在文件夹中循环并删除 .xlsm 文件
亲爱的，我创建了一个代码来循环遍历文件夹并删除 10 年前的文件，但循环无法正常工作，因为 FolderPath(变量)保持不变并且循环遵循无限循环。有帮助吗？ Sub LoopThroughFol
excel - VBA 代码另存为 .XLSM
需要帮助才能添加命令以另存为 .xlsm:- Private Sub cmdSaveForm1_Click() Dim strFolder As String Dim i As Lon
excel - 共享 xlsm 文件
我的工作场所内部服务器中有一个 xlsm 文件。假设我们有 2 名 worker 使用此文件，其中包括 2 张，My_sheet和His_sheet . 我正在努力寻找一种方法让我们每个人都可以处理“
excel - 强制另存为 XLSM，同时维护文件结构
所以我正在使用 XLTM 文件，我希望用户确保它们保存为 XLSM。当他们单击“保存”时，效果很好，但我发现当他们单击“另存为”时，文件被保存为“*.xlsm.xlsm”。我对如何确保用户保存为 XL
java - 如何从 xlsm 加密文件中读取？
我正在尝试从用密码加密的 xlsm Excel 文件中读取数据。到目前为止，我在 Apache POI 网站上找到的方法和堆栈溢出都没有成功这是我到目前为止所尝试的，以及我得到的异常: S
python - 如何以编程方式将简单数据写入复杂的 .xlsm 文档而不破坏它？
我有一个非常复杂的 Excel 工作簿，格式为 .xlsm，其中包含宏、命名范围以及所有花里胡哨的东西。我需要将 CSV 文件的内容放入此工作簿中的工作表(已存在)中，从最简单的意义上说:第 1 行第
带有宏的 PHPExcel 克隆 .xlsm
我正在尝试使用 PHPExcel 读取、克隆和写入 .xlsm 文件，但出现错误: fatal error :未捕获异常“异常”，消息为“工作表!G177 -> 公式错误:发生意外错误”... 任何人
带有宏的 PHPExcel XLSM 文件
是否可以用 phpexcel 读写带有宏文件的 xlsm？我测试这段代码只是为了复制原始文件: $objReader = PHPExcel_IOFactory::createReader('Exce
VBA-xlsm 文件有错误 40036，工作表名称相似
我正在编写的宏有问题。我有我正在编写宏的 xlsm 文件，它正在创建一个模板，该模板从其他人发送给我的多个电子表格中获取数据。但是，我用于信息的一个文件是 xlsm 文件，这给我带来了问题。我相信我已
vba - 严格使用 Excel 打开 .xlsm
我想启用我的宏.xlsm文件，只能使用 Excel 打开。我可以知道并拒绝其他试图打开它的应用程序吗？ Private Sub Workbook_Open() ... End Sub 最佳答案您可
vba - 将变量从 XLSM 传递到嵌入式 DOCM
我有一个嵌入的 Word 文档 (*.docm)在我的 Excel 工作表中。 Word 文档包含 table , 与其对应的Table 有关系在 Excel 的 WorkSheet . 我希望在 D
excel - 将 XLSM 保存到 XLSX
我正在努力将我的 XLSM 转换为 XLSX 文件..它是在转换为 PDF 之前，我试图改变一点但没有成功。我想与工作簿具有相同的名称，但只是 XLSX 格式。 Sub xlsmtoxlsx() D
vba - Excel，循环遍历 XLSM 文件并将行复制到另一张纸
我现在使用此代码遇到的主要问题是处理我打开的 xlsm 文件的错误。我对这些文件的 VB 代码没有编辑权限。如果 vb 出错，有没有办法跳过文件？我有一个包含大约 99 个 xlsm 文件的文件夹，
excel - 无法从 xlsx 粘贴到 xlsm
最奇怪的事情发生在我身上。我有一个 xlsm 工作簿，其中包含各个级别的许多宏(常规、工作表、工作簿)。一切都按预期工作，但如果我尝试从 xlsx 工作簿复制一些单元格并将它们粘贴到我的 xlsm 工

首页

博学

6Ren·AI

商城

python - 使用 pandas 将多个 xlsm 文件自动转换为多个 csv 文件

更新的代码: