gpt4 book ai didi

python - 从 docx 文件中提取特定字体的文本

转载 作者:太空宇宙 更新时间:2023-11-03 11:29:22 24 4
gpt4 key购买 nike

我正在使用 python 3.4 和 python-docx 库来处理 .docx 文件。我已经能够从文档中提取文本。但我的目标是只提取具有特定字体的文本(并修改它们)。

我一直在 library documentation 中搜索这个这两天一直没有结果。

这里有没有人有使用这个库的经验,如果有的话,他们能给我指明正确的方向吗。

最佳答案

目前,python-docx 只能使用样式来应用字体字样。您可以像这样检测具有特定风格的运行:

document = Document('having-fonts.docx')
for paragraph in document.paragraphs:
for run in paragraph.runs:
if run.style == style_I_want:
print run.text

如果使用段落样式应用特殊字体,您可以使用:

document = Document('having-fonts.docx')
for paragraph in document.paragraphs:
if paragraph.style == style_I_want:
print paragraph.text

如果你能说更多细节,我可能会更具体。

关于python - 从 docx 文件中提取特定字体的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25603143/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com