python - 如何使用 python-pptx 从 powerpoint 中的组形状中的文本形状中提取文本。-6ren

python - 如何使用 python-pptx 从 powerpoint 中的组形状中的文本形状中提取文本。

转载作者：行者123 更新时间：2023-11-28 22:17:03

26

4

我的 PowerPoint 幻灯片有许多组形状，其中有子文本形状。

之前我使用过这段代码，但它不处理组形状。

for eachfile in files:
prs = Presentation(eachfile)

textrun=[]
for slide in prs.slides:
    for shape in slide.shapes:
        if hasattr(shape, "text"):
            print(shape.text)
            textrun.append(shape.text)
new_list=" ".join(textrun)
text_list.append(new_list)

我正在尝试从这些子文本框中提取文本。我已经设法使用 GroupShape.shape 到达这些子元素但是我得到一个错误，这些是“property”类型，所以我无法访问文本或迭代(TypeError:“property”对象不可迭代)。

from pptx.shapes.group import GroupShape
from pptx import Presentation
for eachfile in files:
prs = Presentation(eachfile)

textrun=[]
for slide in prs.slides:
    for shape in slide.shapes:
        for text in GroupShape.shapes:
            print(text)

然后我想捕获文本并附加到一个字符串以供进一步处理。

所以我的问题是，如何访问子文本元素并从中提取文本。

我花了很多时间浏览文档和源代码，但一直没弄明白。任何帮助将不胜感激。

最佳答案

我想你需要这样的东西:

from pptx.enum.shapes import MSO_SHAPE_TYPE

for slide in prs.slides:
    # ---only operate on group shapes---
    group_shapes = [
        shp for shp in slide.shapes
        if shp.shape_type == MSO_SHAPE_TYPE.GROUP
    ]
    for group_shape in group_shapes:
        for shape in group_shape.shapes:
            if shape.has_text_frame:
                print(shape.text)

组形状包含其他形状，可在其 .shapes 属性中访问。它不本身具有.text 属性。因此，您需要迭代组中的形状并从每个形状中获取文本。

请注意，此解决方案仅深入一层。可以使用递归方法按深度优先遍历树，并从包含组的组中获取文本(如果有的话)。

另请注意，并非所有形状都有文本，因此您必须检查 .has_text_frame 属性以避免在图片形状上引发异常。

关于python - 如何使用 python-pptx 从 powerpoint 中的组形状中的文本形状中提取文本。，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51701626/

26

4

0

文章推荐： python - 如何处理 Python 模块中的冗余/重复导入？

文章推荐： python - manage.py runserver 打开pycharm而不是running server

文章推荐： azure - Azure Bitnami 中的 tomcat 或 root 密码

文章推荐： python - 凯拉斯/ tensorflow : Combined Loss function for single output

powerpoint - Visio/PowerPoint 有什么好的替代品吗？
关闭。这个问题是off-topic .它目前不接受答案。想改善这个问题吗？ Update the question所以它是 on-topic对于堆栈溢出。 9年前关闭。 Improve this q
powerpoint - 将 PowerPoint 加载项中的宏添加到功能区
通过右键单击功能区并选择“从以下位置选择命令:宏”，可以从功能区的启用宏的 PowerPoint (pptm) 演示文稿中添加宏。我希望它随时可用，所以我将 pptm 文件保存为加载项 (ppam)
powerpoint - Markdown 或标记到 powerpoint？
我需要在 Latex Beamer 和 Powerpoint 中维护一些幻灯片。 (这是为了向其他地方的教师提供幻灯片，其中 90% 的教师不知道如何使用 Latex，也不愿意学习它。而我是 Linu
powerpoint - JavaScript 与 PowerPoint 文档的交互
我有一个用于 PowerPoint 的任务 Pane 加载项，它可以帮助用户处理事件演示文稿上的任务。随着 Microsoft Office 在 Windows 以外的平台上越来越流行，使用 Java
powerpoint - 如何在 Powerpoint 2010 中同时调整所有幻灯片上的字体大小？
已关闭。这个问题是 off-topic 。目前不接受答案。想要改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。已关闭10 年前。 Improve th
powerpoint - 在 PowerPoint 中找不到 StoryBoarding 选项卡
不知何故，我丢失了 PowerPoint 中的 Storyboard 标签。我怎样才能恢复它？谢谢。我同时使用 PowerPoint 2010 和 PowerPoint 2013 最佳答案我遇到了
powerpoint - 在 powerpoint 幻灯片中显示从 plotly 生成的交互式离线绘图
我用 plotly 生成了一个离线交互图。我将绘图保存为 html 文件。有谁知道我可以将交互式绘图嵌入到 MS PowerPoint 中进行演示？非常感谢! 最佳答案 PowerPoint 本身
c# - 以编程方式生成的 PowerPoint 演示文稿破坏了 PowerPoint 2013
我正在尝试从不同来源生成演示文稿。基本上我有大约 200 张幻灯片来自一些 PowerPoint 演示文稿。为了实现这一点，我使用了 OpenXml Sdk。程序流程如下: 打开模板演示打开新演示文
powerpoint - 在 Powerpoint 幻灯片中插入形状(Office Javascript API)
是否可以在 PowerPoint 幻灯片中添加形状(或除纯文本或图像之外的任何其他内容)？我在上面找不到任何东西，真的希望这是可能的。我已经在 UserVoice ( https://offices
powerpoint - 在 Linux 中将 Powerpoint 转换为 Flash
我希望在 Linux 中以自动方式将 PPT 和 PPTX 文件转换为 Flash(或 flv)文件 - 所以我需要一个命令行实用程序。有什么可用的选择吗？ (目前我还没有找到)。我也在寻找一个
c# - PowerPoint 2007 中的 PowerPoint.Point 对象
我在 PowerPoint 2010 中制作了一个模块原型(prototype)。该模块在 PowerPoint 图表上绘制了一些线条和形状。我使用了 PowerPoint.Point(系列的数据点)
powerpoint - 如何在 PowerPoint 和 office.js 中使用自定义 xml？
在 Word 中，您可以使用 Office.context.document.customXmlParts API 来访问自定义 xml。在 Excel 中，您必须使用 Excel.run((cont
vba - 从 PowerPoint 2003 以编程方式另存为 PowerPoint 2007 (pptx)
我需要能够将 PowerPoint 2003 中的演示文稿(以编程方式)保存为 OpenXML(“.pptx”)。我安装了 Microsoft Office 兼容包。这确实允许我从 PowerPoi
c# - 如何在 Powerpoint 插件中让 Powerpoint SaveAs WMV 具有高优先级？
我的任务是在将当前 powerpoint 保存为 WMV 后获取电影帧。以下代码作为独立应用程序运行良好，但由于“CreateVideoStatus”作为 Powerpoint 加载项运行时始终为“P
ios - 在 Ipad 上的 PowerPoint 中打开 PowerPoint 文件
我正在尝试从移动版 Safari 链接到一个 .pptx 文件，并在 PowerPoint 中打开该文件。根据 https://www.test.com/test.pptx 上的信息，我的链接看起来像
powerpoint - 微软 PowerPoint : how to convert a shape's position and size into screen coordinates?
我为 PowerPoint (2010) 写了一个小的 VBA 宏，当鼠标悬停在某个形状上时，它会打开一个带有解释的弹出窗口。这很好用。 las，再次离开该区域时没有触发任何事件，所以我现在想扩展代码
powerpoint - 将 Open XML 注入(inject) Open PowerPoint 演示文稿
我正在寻找注入(inject)的方法PresentationML 和/或绘图ML 使用 Open XML SDK 或只是 System.IO.Packaging 进入打开的 PowerPoint 2
c# - Microsoft.Office.Interop.PowerPoint.dll PowerPoint CustomDocumentProperties 大问题
我有一个可以将幻灯片导出到 PowerPoint 的应用程序。我正在使用 Microsoft.Office.Interop.PowerPoint.dll 。这是汇编的第 11 个版本。我今天运行了应用
powerpoint - 如何在 PIA 中像 Word 和 Excel 一样取消 PowerPoint 的关闭事件？
当 Microsoft Word 关闭时，可以取消关闭事件。对于 Excel 也是如此。但是 PowerPoint 关闭事件没有取消标志。是否可以通过其他方式取消事件？最佳答案在关闭事件中，您
excel - 在 Excel 中使用 VBA 从 PowerPoint 模板创建新的 PowerPoint 演示文稿
我有一个 Excel 宏，可以从指定位置打开 PowerPoint 文件。 PowerPoint 文件是一个模板。我需要根据模板设计创建一个新的演示文稿。我的代码将打开模板而不是基于该模板的新演示

首页

博学

6Ren·AI

商城

python - 如何使用 python-pptx 从 powerpoint 中的组形状中的文本形状中提取文本。