gpt4 book ai didi

python - 有没有办法将字符串从基于行空间的文件中拆分出来?

转载 作者:行者123 更新时间:2023-12-04 01:08:57 25 4
gpt4 key购买 nike

假设我有一个包含以下内容的文件


Pellentesque dapibus suscipit ligula. Donec posuere augue in qu
am. Etiam vel tortor sodales tellus ultricies commodo. Suspendisse potenti. Aenean in
sem ac leo mollis blandit. Donec neque quam, dignissim in, molli
s nec, sagittis eu, wisi. Phasellus lacus. Etiam laoreet quam se
d arcu. Phasellus at dui in ligula mollis ultricies. Integer pl
acerat tristique nisl. Praesent augue. Fusce commodo. Vestibul
um convallis, lorem a tempus semper, dui dui euismod elit, vitae placer
at urna tortor vitae lacus. Nullam libero mauris, consequat quis, var
ius et, dictum id, arcu. Mauris mollis tincidunt felis.
Aliquam feugiat tellus ut neque. Nulla facilisis, risus a rhoncus
fermentum, tellus tellus lacinia purus, et dictum nunc justo sit amet elit.


Pellentesque dapibus suscipit ligula. Donec posuere augue in q
uam. Etiam vel tortor sodales tellus ultricies commodo. Suspendisse
potenti. Aenean in sem ac leo mollis blandit. Donec neque quam,
dignissim in, mollis nec, sagittis eu, wisi. Phasellus lacus. Etiam lao
reet quam sed arcu. Phasellus at dui in ligula mollis ultricies.
Integer placerat tristique nisl. Praesent augue. Fusce commodo.
Vestibulum convallis, lorem a tempus semper, dui dui euismod elit,
vitae placerat urna tortor vitae lacus
. Nullam libero mauris, consequat quis,
varius et, dictum id, arcu. Mauris mollis tincidunt felis.
Aliquam feugiat tellus ut neque. Nulla facilisis, risus a
rhoncus fermentum, tellus tellus lacinia pur us, et dictum nunc justo sit amet elit.

段落之间有行间距。所以我想根据行间距拆分文件,一个段落作为数组中的一个字符串。

我尝试了 .split("\n").splitlines() 但它们都基于行而不是行间隙进行拆分。有没有办法根据行间距进行拆分?

最佳答案

您可以使用正则表达式来拆分 2 个或更多换行符:

import re

paragraphs = re.split(r"\n{2,}", text)
len(paragraphs)
# 2

如果空行可能包含空格,您可以修改正则表达式:

paragraphs = re.split(r"\n\s*\n", text)

关于python - 有没有办法将字符串从基于行空间的文件中拆分出来?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65437049/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com