gpt4 book ai didi

python - 如何从文本中删除行直到关键字

转载 作者:行者123 更新时间:2023-12-04 07:36:25 24 4
gpt4 key购买 nike

我正在请求一个维基百科页面,该页面返回该网站的所有文本,如下所示:

def my_function(addr):
response = requests.get(addr)
print(response.text)

my_function("https://en.wikipedia.org/wiki/Web_scraping")
现在我试图做的基本上是删除不需要的部分,基本上是在 id 类 'See_also' 之前的所有文本。有没有正确和简单的方法来做到这一点?我不能只删除一定数量的行,因为此代码适用于不同的 wiki 站点。

最佳答案

您可以使用 REGEX (欢呼)。

import requests
import re

def my_function(addr):
response = requests.get(addr)
print(re.findall("See_also[\\s\\S]*", response.text))

my_function("https://en.wikipedia.org/wiki/Web_scraping")

关于python - 如何从文本中删除行直到关键字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67721531/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com