python - 为什么 lxml 找不到这个类？-6ren

python - 为什么 lxml 找不到这个类？

转载作者：行者123 更新时间：2023-11-28 18:11:04

25

4

我正在尝试使用 Python 从页面中抓取一些文本。应该很容易，但是lxml似乎总是让我感到惊讶。这是我尝试过的:

>>> import lxml.html
>>> import urllib

>>> response = urllib.urlopen('http://www.codecademy.com/username')
>>> tree = lxml.html.parse(response)
>>> root = tree.getroot()
>>> root.find_class('stat-count')
[]

我很困惑。以下内容在 html 中:<span class="stat-count">27</span> (同一个类(class)有第二个跨度。)我无法想象为什么 find_class方法以这种方式适用于某些元素，但不适用于其他元素。

我愿意接受任何获取第一个 span 内容的策略标签。但我真的很想深入了解执行此操作的正确方法。我想认为使用 lxml会比使用正则表达式更快且更易于维护，但我似乎从未有过良好的体验。

最佳答案

如果 root = tree.getroot()，它应该可以工作。

import lxml.html
import urllib

response = urllib.urlopen('http://www.codecademy.com/username')
tree = lxml.html.parse(response)
# tree.write('/tmp/test.html')
root = tree.getroot()
print(root.find_class('stat-count'))

产量

[<Element span at 0xa3146bc>, <Element span at 0xa3146ec>]

关于python - 为什么 lxml 找不到这个类？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18626245/

25

4

0

文章推荐： css - 如何在 IE8 中实现没有滚动条的整页背景

文章推荐： javascript - 在复选框上显示框或输入框

文章推荐： javascript - 无法在我的网站上删除 FOUC

grails - Cereal ，哥伦。按 parent 找 child ，按 child 找 parent
例如，我有一个父类Author: class Author { String name static hasMany = [ fiction: Book,
javascript - DOJO:找 child
代码如下: dojo.query(subNav.navClass).forEach(function(node, index, arr){ if(dojo.style(node, 'd
mysql - 加入两张 table 找 friend
我有一个带有 Id 和姓名的学生表和一个带有 Id 和 friend Id 的 Friends 表。我想加入这两个表并找到学生的 friend 。例如，Ashley 的 friend 是 Saman
grails - Grails按 child 找 parent
我通过互联网浏览，但仍未找到问题的答案。应该很容易: class Parent { String name Child child } 当我有一个 child 对象时，如何获得它的 paren
android - Firebase Android 找 friend 功能
我正在尝试创建一个以 Firebase 作为我的后端的社交应用。现在我正面临如何(在哪里？)找到 friend 功能的问题。我有每个用户的邮件地址。我可以访问用户的电话也预订。在传统的后端中，我
ios - Apple Game Center 和 Facebook 找 friend iOS6
我主要想澄清以下几点: 1。有人告诉我，在 iOS 5 及以下版本中，如果您使用 Game Center 设置多人游戏，则“查找 Facebook 好友”(如与好友争夺战)的功能不是内置的，因此您需要
docker - 有什么用!意思？找。\! -用户redis -exec chown redis '{}' +
关于redis docker镜像ENTRYPOINT脚本 docker-entrypoint.sh : #!/bin/sh set -e # first arg is `-f` or `--some-

首页

博学

6Ren·AI

商城

python - 为什么 lxml 找不到这个类？