gpt4 book ai didi

python - python 或 perl 中的正则表达式脚本

转载 作者:行者123 更新时间:2023-11-28 19:51:22 25 4
gpt4 key购买 nike

如果有人可以帮助我用 python 或 perl 编写脚本,它会从给定的文件中检索所有句子,如:

[LANG::...]
  • ...意味着什么

例如:

[LANG::Sample text with digits 0123]

并将其以单行形式写入文件。

非常感谢您的帮助

编辑:

感谢您的帮助,现在是更高级的东西。

如果它找到类似 [:ANG::...] 的内容,请只写 ... 不带括号的 ang LANG::标记。

谢谢你们,你们真棒:)

最佳答案

import re

with open('input.txt', 'w') as f:
text = f.read()
#text = 'Intro [LANG::First text 1] goes on [LANG::Second text 2] and finishes.'

with open('output.txt', 'w') as f:
for match in re.findall('\[LANG::.*?\]', text):
f.write(match+'\n')

输出:

[LANG::First text 1]
[LANG::Second text 2]

问题的第二部分:如果它找到类似 [:ANG::...] 的内容,请只写 ... 不带方括号和 LANG::标记。

将最后一部分改为:

with open('output.txt', 'w') as f:
for match in re.findall('\[.ANG::.*?\]', text):
if match.startswith('[:ANG'):
f.write(match[7:-1]+'\n')
else:
f.write(match+'\n')

根据您的需要修复该子字符串部分 match[7:-1]

关于python - python 或 perl 中的正则表达式脚本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5349783/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com