gpt4 book ai didi

python - 在 Python 中将 ppt 文件转换为 pptx

转载 作者:太空狗 更新时间:2023-10-30 01:36:42 25 4
gpt4 key购买 nike

有什么方法可以将 .ppt 文件转换为 .pptx 文件。

目标: 我需要从 .ppt 文件中提取表格中的文本(列名是姓名、地址、联系电话、电子邮件等)。为此,我采用了这种方法:

我将 .ppt 文件转换为 pdf,然后使用 PDFminer 从 pdf 中提取数据。从 pdf 中提取的文本没有任何分隔符分隔。因此很难区分表中的名称和其他字段。

我正在研究的可能解决方案:

  1. 将 .ppt 文件转换为 .pptx
  2. 解析.pptx文件的xml得到格式化的文本

我卡在了将文件格式从 .ppt 转换为 .pptx 的第一步。我找不到在 python 中将 .ppt 文件格式转换为 .pptx 格式的任何解决方案。

最佳答案

我已经创建了这段代码希望这对你有用:

    import win32com.client
PptApp = win32com.client.Dispatch("Powerpoint.Application")
PptApp.Visible = True
PPtPresentation = PptApp.Presentations.Open(r'D:\ppt\sample.ppt')
PPtPresentation.SaveAs(r'D:\ppt\final.pptx', 24)
PPtPresentation.close()
PptApp.Quit()

关于python - 在 Python 中将 ppt 文件转换为 pptx,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45670024/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com