gpt4 book ai didi

python - 使用 urllib 和 BeautifulSoup 通过 Python 从 web 检索信息

转载 作者:太空狗 更新时间:2023-10-29 18:19:43 25 4
gpt4 key购买 nike

我可以使用 urllib 获取 html 页面,并使用 BeautifulSoup 解析 html 页面,看起来我必须生成要从 BeautifulSoup 读取的文件。

import urllib                                       
sock = urllib.urlopen("http://SOMEWHERE")
htmlSource = sock.read()
sock.close()
--> write to file

有没有办法在不从 urllib 生成文件的情况下调用 BeautifulSoup?

最佳答案

from BeautifulSoup import BeautifulSoup

soup = BeautifulSoup(htmlSource)

无需写入文件:只需传入 HTML 字符串即可。也可以直接传递 urlopen 返回的对象:

f = urllib.urlopen("http://SOMEWHERE") 
soup = BeautifulSoup(f)

关于python - 使用 urllib 和 BeautifulSoup 通过 Python 从 web 检索信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2647179/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com