gpt4 book ai didi

Python 正则表达式文本到 json 脚本以获取同一单词出现之间的所有文本?

转载 作者:太空宇宙 更新时间:2023-11-04 02:04:17 25 4
gpt4 key购买 nike

你好,我正在编写一个 python 正则表达式解析器,我正在尝试编写一个正则表达式来选择大量文本中单词 QUESTION 之间的文本。

示例文本

Exam A
QUESTION 1
Blank is designed to help users.
A. baba.
B. caca.
C. sasa.
D. tyty.
Correct Answer: D
Explanation
Explanation/Reference:
QUESTION 2
can I do something?
A. No
B. Yes
Correct Answer: C
Explanation
Explanation/Reference:
QUESTION 3
What does provide?
asdasdasd


import re
import os
import sys


questions_file_text = open("questionguide.txt", "r").read()


Questions = re.findall("(?:(?!QUESTION).|[\n\r])*QUESTION",questions_file_text)

因此我想选择所有内容,包括问题编号,直到下一个问题出现。这样我就可以进行一些文本解析以将其格式化为 json。

我可以使用 python 我只是似乎无法正确使用我的 RegEx 有人可以帮助我吗。

MyQuestion这是我得到的最接近的 enter image description here

最佳答案

好吧,我是笨蛋,这就是答案:

import re
import os
import sys


questions_file_text = open("guide.txt", "r").read()


Questions = re.findall("(QUESTION([\s\S]*?)QUESTION)",questions_file_text)

print Questions

关于Python 正则表达式文本到 json 脚本以获取同一单词出现之间的所有文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55053076/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com