gpt4 book ai didi

python - Beautiful Soup 返回空 html

转载 作者:太空宇宙 更新时间:2023-11-04 15:51:44 26 4
gpt4 key购买 nike

所以这是我关于 Beautiful Soup 的第二个问题(抱歉,我是初学者)

我试图从这个网站获取数据:

https://www.ccna8.com/ccna4-v6-0-final-exam-full-100-2017/

我的代码:

from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup

url = 'https://www.ccna8.com/ccna4-v6-0-final-exam-full-100-2017/'

uClient = uReq(url)
page_html = uClient.read()
uClient.close()
page_soup = soup(page_html, "lxml")

print(page_soup)

但由于某种原因,它返回一个空字符串。

我一直在搜索类似的线程,显然它与使用外部 api 的网站有关,但该网站没有。

network of website

最佳答案

响应的内容类型似乎是 gzip,因此您需要先处理它,然后才能处理 html 响应。

from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
import gzip

url = 'https://www.ccna8.com/ccna4-v6-0-final-exam-full-100-2017/'

uClient = uReq(url)
page_html = gzip.decompress(uClient.read())
uClient.close()
page_soup = soup(page_html, "lxml")
print(page_soup)

关于python - Beautiful Soup 返回空 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49576821/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com