gpt4 book ai didi

python - 使用双回车将大文本文件分成单独的文件

转载 作者:行者123 更新时间:2023-12-01 04:25:19 25 4
gpt4 key购买 nike

我在 Windows 7 中使用 Python 2.7。我有一个大文本文件,我想将其分解为几个较小的文件。当前文件的格式如下所示。 。 。

Double carriage return
Header line
Body (consisting of several lines)
Double carriage return
Header line
Body (consisting of several lines)

我想使用标题行作为文件名和正文作为文件内容来创建单独的文本文件。双回车符标识新文件的开始。

我已经搜索了 Stack Overflow,但没有找到我要找的内容。我对 Python 非常陌生,因此我们将不胜感激。

到目前为止我拥有的代码是 . 。 。

fh = open(path/file.txt)
data = fh.read()
doc = re.split(r'[\r\n\r\n]',data)
for para in doc:
header = re.search('^[1-9].+Chapter', para)
filename = str(header) + ".txt"
fwrite = open(filename,"w")
fwrite.write(para)
fwrite.close()

我想使用第一行作为文本文件标题。

最佳答案

第一行无法正确打开文件,假设其他所有内容都存在,这应该可以工作。将文件打开在 try Exception block 中的最佳实践

fh = open('path/file.txt','r')
data = fh.read()
doc = re.split(r'[\r\n\r\n]',data)
for para in doc:
header = re.search('^[1-9].+Chapter', para)
filename = str(header) + ".txt"
fwrite = open(filename,"w")
fwrite.write(para)
fwrite.close()

关于python - 使用双回车将大文本文件分成单独的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33220104/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com