gpt4 book ai didi

python - 如何根据最后一次出现的小写字母后跟大写字母来分隔数据框中的句子

转载 作者:太空宇宙 更新时间:2023-11-03 23:57:03 25 4
gpt4 key购买 nike

我有一个包含句子的数据框。第一句话(标题)之后是正文。它们没有空格就合并了。

我想根据大写字母在小写字母后面没有空格的最后一次出现将文本分成两部分(句子 1 和句子 2)(出于好奇,我也对解决方案感兴趣基于第一次出现)。

解决方案应该存储在原始数据框中。

我试过了

re.findall('(?<!\s)[A-ZÄÖÜ](?:[a-zäöüß\s]|(?<=\s)[A-ZÄÖÜ])*')

但无法解决。

import pandas
from pandas import DataFrame

Sentences = {'Sentence': ['RnB music all nightI love going out','Example sentence with no meaningThe space is missing.','Third exampleAlso numbers 1.23 and signs -. should appear in column 2.', 'BestMusic tonightAt 12:00.']}

df = DataFrame(Sentences,columns= ['Sentence'])

print(df)

因为拆分应该在最后一次出现时进行。示例中的 RnBBestMusic 不应触发拆分。

df.Sentence1 = ['RnB music all night','Example sentence with no meaning','Third example', 'BestMusic tonight']

df.Sentence2 = ['I love going out','The space is missing.', 'Also numbers 1.23 and signs -. should appear in column 2.' ,'At 12:00.']

最佳答案

这是一种方式

Yourdf=df.Sentence.str.split(r'(.*[a-z])(?=[A-Z])',n=-1,expand=True)[[1,2]]
Yourdf
Out[610]:
1 2
0 RnB music all night I love going out
1 Example sentence with no meaning The space is missing.
2 Third example Also numbers 1.23 and signs -. should appear i...
3 BestMusic tonight At 12:00.

关于python - 如何根据最后一次出现的小写字母后跟大写字母来分隔数据框中的句子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57293300/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com