Python 网络抓取 : problems with classes-6ren

Python 网络抓取 : problems with classes

转载作者：太空宇宙更新时间：2023-11-04 02:44:43

25

4

我正试图从这个 website 中抓取房地产经纪人的名字.

我的代码:

containers = page_soup.findAll("div",{"class":"team-details"})

for container in containers:
    agent_name = container.findAll("a", {"class":"team-name_link"})
    name = agent_name[0].text


    print("name: " + name)

但是，当我运行脚本时，我只收到前两个名称，然后是一条错误消息:

name: Michael Stavrianos
name: Kristalla Stavrianos
Traceback (most recent call last):
  File "C:\Users\Toby\Desktop\Webscrape\LjHooker - mark1.py", line 16, in <module>
    name = agent_name[0].text
IndexError: list index out of range

我发现前两个代理名称在“team-name_link”类下，而其余的在“team-name”类下。我不确定如何同时从两组类中抓取名称。

最佳答案

我认为你弄错了，所有名称都在所需标签内，但实际上你需要寻找 div:

from bs4 import BeautifulSoup
import requests

html = requests.get("https://woollahra.ljhooker.com.au/our-team").text
soup = BeautifulSoup(html, 'html.parser')
containers = soup.findAll("div",{"class":"team-details"})

for container in containers:
    agent_name = container.find("div", {"class":"team-name"})
    name = agent_name.text
    print(name)

以上代码输出:

Michael Stavrianos
              Licensee



Kristalla Stavrianos
              Principal



Jade Marshall
              Property Management Associate


Emma Phelan
              Property Management Associate


Isabella Marechal - Ross
              Property Management Associate


Victoria Empson
              Property Investment Manager

关于Python 网络抓取 : problems with classes，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45451728/

25

4

0

文章推荐： Maya 中的 Python 文本字段

文章推荐： javascript - Express 框架给出了一个非常奇怪的错误

文章推荐： xcode - 尝试运行 Node.js 服务器时 vecLib 出现问题。

文章推荐： python - SugarCRM 过滤器 PYTHON

ruby - 狮子 : Problem with RVM installing rubies - problem related to openssl
我很绝望，现在已经两天(!!)天都没有解决方案来解决以下问题。更新 Lion 后，我想使用最新版本的 rvm 安装额外的 rubies。这是我之后调用 bundler 时发生的情况: /Users
PHP无限Ajax循环: any problems?
我的问题: ajax 调用的无限循环会产生问题吗？假设有这样的代码: ajaxcall(); function ajaxcall(){ jQuery.ajax({ typ
knapsack-problem - 曲棍球池算法
这是一个有趣的小项目，我已经开始尝试并最大限度地提高赢得办公室曲棍球池的机会。我试图找到最好的方法来选择 20 名能够在最高工资帽内给我最多分数的球员。例如，假设原始数据由玩家姓名位置(前锋，后
knapsack-problem - 将值列表划分为三个相等的小计
我有一个总数为540000的数字列表。我想将此列表分为3个列表，每个列表总共180000。最有效的编程方法是这样做，假设数字列表是一个平面文件，每个数字为线？最佳答案听起来像Knapsack pr
iPhone 4和5不同分辨率: problems
抱歉，也许因为我不是英语，我不知道，但我找不到解决几个问题的任何资源；也许我用的词不正确.. 我想了解有关 iPhone 4 和 5 不同分辨率的更多信息。首先:如果我开发针对 iPhone 4 分
Nestjs全局缓存: CacheInterceptor problem
在全局配置缓存后，如 docs ，如果我在 app.module 之外使用 CacheInterceptor，它会抛出错误。 app.module.ts const cacheConfig = {
GRAILS g :each problem
我无法让 g:each 工作。我正在尝试遍历任何内容，但它永远不起作用 = 不生成任何 html。索引.gsp Item ${i.name} 用户 Controller .g
WPF列表框: problem with selection
在我的 XAML 文件中，我有一个这样声明的 ListBox:
Java随机: Seeding Problem
想知道你是否可以帮助我: 我有一个名为initializeAll的方法: public final void initializeAll() { //other stuff........ rand
安卓开发 : PNG Problems?
我尝试过使用 XML 和 JAVA 在我的 Android Activity 中创建一个 ImageView。这两次，我都能够获取我一天前创建的所有其他 PNG 资源以显示在 ImageView 中。
MYSQL : problem with mysql_query
我需要你的帮助。这是什么意思？ Warning: mysql_query() [function.mysql-query]: Access denied for user 'ODBC'
Javascript : problem with 'this'
这是一段代码 function test() { this.value = "foo"; } $(document).ready(function () { test();
安卓工作室 : Rendering Problems
这是一些非常基础的东西。渲染期间引发异常:java.util.Locale.toLanguageTag()Ljava/lang/String; XML: 问题似乎出在 Edit
php - 使用朴素贝叶斯分类器对推文进行分类 : some problems
除其他来源外，我还使用 Stackoverflow 上的各种帖子，尝试实现我自己的 PHP 分类器，以将推文分类为正面、中性和负面类别。在编码之前，我需要弄清楚流程。我的思路和例子如下:
Eclipse 错误弹出窗口 : "Certificate Problem"
在过去的几周里，每当我在 Eclipse 上使用 SVN 插件时，我都会收到以下错误: Certificate Problem There is a problem with the site's s
php - mkdir() : Permission problems
我被拒绝运行以下功能(位于 /var/www/mysite/public_html/app/Controllers/Script.php) $structure = '/var/www/mysite/
Emacs : problem with tags file?
我正在使用 ctags 为我的 Emacs 创建标签以使用 cygwin 从中读取符号。 Emacs 说 “访问标签表缓冲区:文件/home/superman/tags 不是有效的标签表” 这是我查找
xslt - XSL : Problem with cicling
我知道作为一种函数式语言，XSL 没有像传统的 for 循环(而是 for-each)那样的东西。我正在尝试从可变数量的元素开始创建一个具有固定数量 (7) 的表。总之，我有
RavenDB : Storage Size Problems
我正在使用RavenDB进行一些测试，以基于iphone应用程序存储数据。该应用程序将发送一个带有GPS key 的5个GPS坐标的字符串。我在RavenDB中看到每个文档约为664-668字节。这是
Java Swing : problems with width
我无法理解我的应用程序的行为。我想创建一个简单的窗口 (1000x700px)，分为两部分(分别为 250px 和 750px 宽度)。我尝试了以下代码: import java.awt.Color;

首页

博学

6Ren·AI

商城

Python 网络抓取 : problems with classes