- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我决定尝试使用 Python(使用 lxml 和 requests)进行网络抓取。我试图抓取学习的网页是:http://www.football-lineups.com/season/Real_Madrid/2013-2014
我想要抓取的是网页左侧的表格(包含分数和所使用的阵型的表格)。这是我正在使用的代码:
from lxml import html
import requests
page=requests.get("http://www.football-lineups.com/season/Real_Madrid/2013-2014")
tree=html.fromstring(page.text)
competition=tree.xpath('//*[@id="sptf"]/table/tbody/tr[2]/td[4]/font/text()')
print competition
我输入的xpath是我从Chrome复制过来的xpath。该代码通常应返回表中第一场比赛的比赛(即西甲)。换句话说,它应该返回第二行第四列条目(网页布局上有一个随机的第二列,我不知道为什么)。但是,当我运行代码时,我得到一个空列表。这段代码哪里可能出错?
最佳答案
如果您检查页面的行源,您将看到阵容表不存在。它是在使用 AJAX 加载页面后提供的,因此您无法仅通过获取 http://www.football-lineups.com/season/Real_Madrid/2013-2014 来获取它。因为 JS 不会被解释,因此 AJAX 不会被执行。
AJAX 请求如下:
也许您可以伪造请求来获取此数据。我会让您分析那些命名良好的 dX 参数是什么:)
关于python - 刚开始抓取,不断获得空列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24163745/
如果这不是一个错误,那就是另一个错误。如果不是那样的话,那就是别的东西了。我觉得我的项目已经改变了很多,现在只是试图解决代码签名问题,结果一切都搞砸了。我严格按照说明进行操作,但出现错误,例如当前的“
我不确定是否有一些我不知道的内置变量或规则,或者 make 是否有问题,或者我只是疯了。 对于我的一个项目,我有一个如下的 makefile: CC=g++ CFLAGS=-O3 `libpng-co
我有大约 10 个 div,它们必须不断翻转,每个 div 延迟 3 秒 这个 codrops 链接的最后一个效果是我正在寻找的,但无需单击 div http://tympanus.net/Devel
我如何使用 jQuery 持续运行 PHP 脚本并每秒获取响应,以及将鼠标上的少量数据发送到同一脚本? 我真的必须添加一些随机扩展才能让这么简单的计时器工作吗? 最佳答案 To iterate is
JBoss 4.x EJB 3.0 我见过如下代码(大大简化): @Stateless @TransactionAttribute(TransactionAttributeType.NOT_SUPPO
使用 PHPStorm,我试图忽略每次尝试进行 git 提交时 pop 的 workspace.xml。 我的 .gitignore 看起来像: /.idea/ .idea/workspace.xml
我是一名优秀的程序员,十分优秀!