- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 Python 从页面中抓取一些文本。应该很容易,但是lxml
似乎总是让我感到惊讶。这是我尝试过的:
>>> import lxml.html
>>> import urllib
>>> response = urllib.urlopen('http://www.codecademy.com/username')
>>> tree = lxml.html.parse(response)
>>> root = tree.getroot()
>>> root.find_class('stat-count')
[]
我很困惑。以下内容在 html 中:<span class="stat-count">27</span>
(同一个类(class)有第二个跨度。)我无法想象为什么 find_class
方法以这种方式适用于某些元素,但不适用于其他元素。
我愿意接受任何获取第一个 span
内容的策略标签。但我真的很想深入了解执行此操作的正确方法。我想认为使用 lxml
会比使用正则表达式更快且更易于维护,但我似乎从未有过良好的体验。
最佳答案
如果 root = tree.getroot()
,它应该可以工作。
import lxml.html
import urllib
response = urllib.urlopen('http://www.codecademy.com/username')
tree = lxml.html.parse(response)
# tree.write('/tmp/test.html')
root = tree.getroot()
print(root.find_class('stat-count'))
产量
[<Element span at 0xa3146bc>, <Element span at 0xa3146ec>]
关于python - 为什么 lxml 找不到这个类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18626245/
例如,我有一个父类Author: class Author { String name static hasMany = [ fiction: Book,
代码如下: dojo.query(subNav.navClass).forEach(function(node, index, arr){ if(dojo.style(node, 'd
我有一个带有 Id 和姓名的学生表和一个带有 Id 和 friend Id 的 Friends 表。我想加入这两个表并找到学生的 friend 。 例如,Ashley 的 friend 是 Saman
我通过互联网浏览,但仍未找到问题的答案。应该很容易: class Parent { String name Child child } 当我有一个 child 对象时,如何获得它的 paren
我正在尝试创建一个以 Firebase 作为我的后端的社交应用。现在我正面临如何(在哪里?)找到 friend 功能的问题。 我有每个用户的邮件地址。 我可以访问用户的电话也预订。 在传统的后端中,我
我主要想澄清以下几点: 1。有人告诉我,在 iOS 5 及以下版本中,如果您使用 Game Center 设置多人游戏,则“查找 Facebook 好友”(如与好友争夺战)的功能不是内置的,因此您需要
关于redis docker镜像ENTRYPOINT脚本 docker-entrypoint.sh : #!/bin/sh set -e # first arg is `-f` or `--some-
我是一名优秀的程序员,十分优秀!