gpt4 book ai didi

python - 从网页抓取的 html 页面中的 Python 脚本中提取列表

转载 作者:行者123 更新时间:2023-12-01 06:49:36 31 4
gpt4 key购买 nike

我是网络抓取新手,遇到了一个小障碍,代码如下:

import requests
from bs4 import BeautifulSoup
url = "www.website.com"
page = requests.get(url)
soup = BeautifulSoup(page.content, "html.parser")
price_scripts = soup.find_all('script')[23]
print(price_scripts)

提取的脚本似乎都是Python脚本。以下是上面代码打印的内容:

<script>
p.a = [0,"6.93","9.34","3.42","7.88"];
p.output();
</script>

我想做的是从这个脚本中提取列表,但是当我尝试时它只返回“None”。

最佳答案

您应该能够通过这种方式提取数据:

target = price_scripts.text

输出:

p.a = [0,"6.93","9.34","3.42","7.88"];
p.output();

此时,您需要诉诸字符串操作,通过删除括号之间的所有内容,如下所示:

print(target.text.split('[')[1].split(']')[0])

请注意,每次使用 split() 方法都会创建一个列表,因此您必须从列表中选择正确的元素。输出:

0,"6.93","9.34","3.42","7.88"

关于python - 从网页抓取的 html 页面中的 Python 脚本中提取列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59079396/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com