gpt4 book ai didi

python - 使用 Python 在 Mac 上打开 .pages 文件

转载 作者:太空宇宙 更新时间:2023-11-03 18:20:27 24 4
gpt4 key购买 nike

我想打开这样的页面文档:

directory = "/Path/to/file/"
with open(directory+"test.pages") as file:
data = f.readlines()
for line in data:
words = line.split()
print words

然后我得到了这个错误:

IOError: [Errno 21] Is a directory: '/path/to/file/test.pages'

为什么这是一个目录?那我该如何打开它呢?

最佳答案

'/path/to/file/test.pages' 是文件系统上的目录,因此无法在 Python 中打开。您的操作系统正在该目录中捆绑多个文件,并且可能将其呈现为单个包。您可以想象遍历目录并获取内容:

for root, dirs, files in os.walk('/path/to/file/test.pages'):
for file in files:
print os.path.join(root, file)

但是打开文件并尝试读取其内容可能会徒劳无功。

我将向您展示如何尝试查找任何纯文本:

import re
# use a pattern that matches for any letter A-Z, upper and lower, 0-9, and _
pattern = re.compile(r'.*\w+.*')

for root, dirs, files in os.walk('/path/to/file/test.pages'):
for file in files:
# open each file with the context manager so it's automatically closed
# regardless if there's an error. Use the Universal Newlines (U) flag too
# as a best practice (Unix, Linux, and MS have different newlines).
with open(os.path.join(root, file), 'rU') as f:
for line in f:
if re.match(pattern, line):
print line

关于python - 使用 Python 在 Mac 上打开 .pages 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24234823/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com