gpt4 book ai didi

python - 如何使用xpath获取最高页码?

转载 作者:行者123 更新时间:2023-11-28 22:19:16 25 4
gpt4 key购买 nike

我编写了一个 xpath 表达式来从一些 html 元素 中获取 页码 的最大值。但是,在这种情况下,使用下面的 xpath 我得到的最后一个文本是 Next Page。我希望我的 xpath 以这样的方式运行,以便我可以获得最大的数字,如 6 使用它一样。

应该应用 xpath 的元素:

content = """
<div class="nav-links"><span aria-current="page" class="page-numbers current"><span class="meta-nav screen-reader-text">Page </span>1</span>
<a class="page-numbers" href="https://page/2/"><span class="meta-nav screen-reader-text">Page </span>2</a>
<span class="page-numbers dots">…</span>
<a class="page-numbers" href="https://page/6/"><span class="meta-nav screen-reader-text">Page </span>6</a>
<a class="next page-numbers" href="https://page/2/"><span class="screen-reader-text">Next Page</span></a></div>
"""

到目前为止我尝试了什么:

from lxml.html import fromstring

root = fromstring(above_content)
pagenum = root.xpath("//*[contains(@class,'page-numbers')][last()]/span")[0].text
print(pagenum)

我的输出:

Next Page

我希望得到的输出:

6

最佳答案

您可以使用准确的类名来避免获取下一个链接:

//a[@class="page-numbers"][last()]

请注意,contains(@class,'page-numbers') 将返回带有数字和 Next 的链接,而 @class="page-numbers" 仅返回数字

关于python - 如何使用xpath获取最高页码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49897682/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com