python - 美丽汤返回空列表-6ren

python - 美丽汤返回空列表

转载作者：行者123 更新时间：2023-12-01 09:08:40

26

4

我是网络抓取新手。所以我接到了一项任务，从以下位置提取数据:Here

我正在选择“评论”数据集。下面是我的抓取代码。

import requests
from bs4 import BeautifulSoup
url = 'https://www.kaggle.com/hacker-news/hacker-news'
headers = {'User-Agent' : 'Mozilla/5.0'}
response = requests.get(url, headers = headers)
response.status_code
response.content
soup = BeautifulSoup(response.content, 'html.parser')
soup.find_all('tbody', class_ = 'TableBody-kSbjpE jGqIxa')

当我尝试执行最后一个命令时，它返回:[]。

所以，我被困在这里了。我知道我们可以从内核获取数据，但仅出于练习目的我哪里出错了？我是不是选错类(class)了？我想抓取数据并可能将其保存到 CSV 文件或 No-SQL 数据库，首选 Cassandra。

最佳答案

您得到这个[]是因为您想要抓取的数据来自 API，该 API 在网页加载后加载，因此您访问的页面不包含该类

您可以打开浏览器控制台并检查屏幕截图中给出的网络，您会在其中找到要抓取的数据，因此您必须向该 URL 发出请求才能获取数据

您可以在预览选项卡中检索此 URL 中的数据，您可以看到所有数据。

如果你对Python有很好的了解，你也可以用它来抓取数据

https://doc.scrapy.org/en/latest/intro/overview.html

关于python - 美丽汤返回空列表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51839937/

26

4

0

文章推荐： gnome - 在 gedit (gnome) 中增加最近打开的文件列表

文章推荐： plugins - 使用 Retrieve 消息获取实体

文章推荐： kohana - PHPUnit + Kohana : Undefined index: HTTP_HOST

文章推荐： DQL-Documentum 查询

Ruby Greed Koan - 如何改进我的 if/then 汤？
我正在努力学习 Ruby Koans 以尝试学习 Ruby，到目前为止一切顺利。我已经得到了贪婪的公案，在撰写本文时它是 183。我有一个可行的解决方案，但我觉得我只是拼凑了一堆 if/then 逻辑
c++ - 使用 boost 图形库的模板化 typedef 汤
我正在尝试创建一个扩展 boost 图形库行为的类。我希望我的类是一个模板，用户提供一个类型(类)，用于在每个顶点存储属性。那只是背景。我正在努力创建一个更简洁的 typedef 来定义我的新类。基
python - 来自 SUDS.client 的未知字符串格式(汤？)的可能解析器
我正在使用 suds 包从网站查询 API，从他们的网站返回的数据如下所示: (1)。谁能告诉我这是什么格式？ (2)。如果是这样，解析数据的最简单方法是什么？我已经使用 BeautifulSoup
python (汤): get nested data and get last item in a tag
所以我有一个看起来像这样的 html 文档: Speaker Name: Title of Talk | Subtitle | website.com ... [Other Stuff] Poste

首页

博学

6Ren·AI

商城

python - 美丽汤返回空列表