gpt4 book ai didi

python - Scrapy : getting only td elements with ALIGN=RIGHT

转载 作者:太空宇宙 更新时间:2023-11-03 18:59:13 24 4
gpt4 key购买 nike

我正在使用 scrapy 从该网站抓取数据:http://www.nuforc.org/webreports/ndxevent.html

我需要将 UFO 目击事件的日期与次数分开,是的,令人兴奋!

这是我正在抓取的内容的示例

<TR VALIGN=TOP>
<TD><FONT style=FONT-SIZE:11pt FACE="Calibri" COLOR=#000000><A HREF= ndxe201303.html>03/2013</A></TD>
<TD ALIGN=RIGHT><FONT style=FONT-SIZE:11pt FACE="Calibri" COLOR=#000000>108</TD>

因此,在此示例中,日期 = 03/2013,计数 = 108

现在日期不是问题,因为我可以这样做

hxs.select('//tbody//td//font//a//text()').extract()

获取“a”标签内的文本。

但是有没有办法从 td 元素获取样式为 ALIGN=RIGHT 的文本。我查看了文档和选择器,但我很困惑

hxs.select('//tbody[contains(td, "ALIGN")]').extract()

最佳答案

这将从所有<td>中选择文本具有属性 ALIGN="RIGHT" :

hxs.select('//tbody//td[@ALIGN="RIGHT"]//text()').extract()

关于python - Scrapy : getting only td elements with ALIGN=RIGHT,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16440619/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com