gpt4 book ai didi

Python 3 网络抓取工具非常简单,无法正常工作

转载 作者:太空宇宙 更新时间:2023-11-04 09:39:20 25 4
gpt4 key购买 nike

我正在阅读一本名为“自学成才的程序员”的书,但在使用一些 Python 代码时遇到了问题。我让程序运行没有任何错误。问题是没有任何输出。

import urllib.request
from bs4 import BeautifulSoup


class Scraper:
def __init__(self, site):
self.site = site

def scrape(self):
r = urllib.request\
.urlopen(self.site)
html = r.read()
parser = "html.parser"
sp = BeautifulSoup(html, parser)
for tag in sp.find_all("a"):
url = tag.get("href")
if url is None:
continue
if "html" in url:
print("\n" + url)

news = "https://news.google.com/"
Scraper(news).scrape()

最佳答案

查看最后一个“if”语句。如果 url 中没有文本“html”,则不会打印任何内容。尝试删除它并取消缩进:

class Scraper:
def __init__(self, site):
self.site = site

def scrape(self):
r = urllib.request\
.urlopen(self.site)
html = r.read()
parser = "html.parser"
sp = BeautifulSoup(html, parser)
for tag in sp.find_all("a"):
url = tag.get("href")
if url is None:
continue
print("\n" + url)

关于Python 3 网络抓取工具非常简单,无法正常工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52249132/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com