gpt4 book ai didi

html - 使用 BeautifulSoup 超越

转载 作者:行者123 更新时间:2023-11-28 02:51:53 30 4
gpt4 key购买 nike

有没有可能在标签之外使用 BeautifulSoup 。一个恰当的例子是以下页面

http://dsalsrv02.uchicago.edu/cgi-bin/app/biswas-bangala_query.py?page=1

在 html 标签结束后有数据。

最佳答案

据我所知,您可以使用 html.parser orhtml5lib对于这个特定的页面:

import requests
from bs4 import BeautifulSoup

response = requests.get("http://dsalsrv02.uchicago.edu/cgi-bin/app/biswas-bangala_query.py?page=1")

soup = BeautifulSoup(response.content, "html.parser")
# soup = BeautifulSoup(response.content, "html5lib")

lxml 解析器无法很好地处理此页面,它仅被部分解析。

关于html - 使用 BeautifulSoup 超越</html>,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39092148/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com