python mechanize find_link 找到最终匹配的链接-6ren

python mechanize find_link 找到最终匹配的链接

转载作者：行者123 更新时间：2023-11-28 20:53:06

24

4

我有一个页面有 >=1 个链接，文本中有“显示费用”。我可以找到第一个这样的链接

firstLink = br.find_link(text_regex=re.compile("Display charges"),nr=0)

我希望能够找到最终链接。我希望这会起作用

lastLink = br.find_link(text_regex=re.compile("Display charges"),nr=-1)

但在只有一个匹配链接的情况下，它会失败。

请注意:Python 和 mechanize 初学者，但发现了 help(mechanize.Browser)，这是一个重大突破:)

最佳答案

您可以使用 br.links() 生成所有此类链接，然后使用 list(...)[-1] 挑选最后一个:

lastLink = list(br.links(text_regex=re.compile("Display charges")))[-1]

例如:

In [29]: import mechanize

In [30]: import re

In [31]: br=mechanize.Browser()

In [32]: br.open('http://www.example.com')
Out[32]: <response_seek_wrapper at 0xa2b59ec whose wrapped object = <closeable_response at 0xa2b554c whose fp = <socket._fileobject object at 0xa3143ac>>>

In [33]: br.links()
Out[33]: <generator object __call__ at 0xa289af4>

In [34]: list(br.links())
Out[34]: 
[Link(base_url='http://www.iana.org/domains/example/', url='/', text='Homepage[IMG]', tag='a', attrs=[('href', '/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='/domains/', text='Domains', tag='a', attrs=[('href', '/domains/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='/numbers/', text='Numbers', tag='a', attrs=[('href', '/numbers/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='/protocols/', text='Protocols', tag='a', attrs=[('href', '/protocols/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='/about/', text='About IANA', tag='a', attrs=[('href', '/about/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='/go/rfc2606', text='RFC 2606', tag='a', attrs=[('href', '/go/rfc2606')]),
 Link(base_url='http://www.iana.org/domains/example/', url='/about/', text='About', tag='a', attrs=[('href', '/about/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='/domains/', text='Domains', tag='a', attrs=[('href', '/domains/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='/protocols/', text='Protocols', tag='a', attrs=[('href', '/protocols/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='/numbers/', text='Number Resources', tag='a', attrs=[('href', '/numbers/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='http://www.icann.org/', text='Internet Corporation for Assigned Names and Numbers', tag='a', attrs=[('href', 'http://www.icann.org/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='mailto:iana@iana.org?subject=General%20website%20feedback', text='iana@iana.org', tag='a', attrs=[('href', 'mailto:iana@iana.org?subject=General%20website%20feedback')])]

In [35]: list(br.links(text_regex=re.compile("About")))
Out[35]: 
[Link(base_url='http://www.iana.org/domains/example/', url='/about/', text='About IANA', tag='a', attrs=[('href', '/about/')]),
 Link(base_url='http://www.iana.org/domains/example/', url='/about/', text='About', tag='a', attrs=[('href', '/about/')])]

关于python mechanize find_link 找到最终匹配的链接，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5513059/

24

4

0

文章推荐： php - 如何在html文本区域中逐句获取字符串

文章推荐： php - 在 Laravel 中测试存储方法

文章推荐： javascript - 具有水平滚动但单独页面的网站

iphone - 如何表明代码需要被删除......最终
考虑需要与 iOS 5 和 iOS 6 兼容的应用。有没有办法标记纯粹为了 iOS 5 兼容性而存在的代码，以便当部署目标最终更改为 iOS 6 时它显示为编译错误(或警告)？像这样: #IF_D
Javascript:最终/不可变的全局变量？
我想我知道答案但是...有什么方法可以防止全局变量被稍后执行的修改吗？？我知道全局变量首先是不好的，但在必要时，有没有办法让它成为“最终”或“不可变”？欢迎黑客/创造性的解决方案。谢谢最佳答案
scala - 最终 val 会增加对象大小吗？
class Foo { final val pi = 3 } 是否每Foo对象有一个 pi成员？因此我应该把 pi在伴生对象中？最佳答案如果您担心内存占用，您可以考虑将此字段移动到伴随对象中。
multithreading - 最终 Web 开发框架的功能要求？
随着可用的 Web 开发框架种类繁多，似乎总是有一种“尝试新事物”的永久动机。因此，我们中的一些人发现自己用一个框架换另一个框架，从来没有对最终结果完全满意。当然，总会有一个特定的 Web 框架可以完
javascript - 最终 block 中的return语句
在MDN中指出， If the finally block returns a value, this value becomes the return value of the entire try
javascript - 最终 else if 语句未运行
我正在尝试用 JavaScript 制作一个基本的井字棋类型游戏。尽管 x 和 y 值在 if 语句的范围内，但除最后一个之外的所有空格都有效。我不知道为什么最后的 else if 语句不起作用。
unit-testing - 如何使用PowerMock模拟Kotlin类(最终)？
我想知道如何使用PowerMock模拟kotlin最终类(class)，以便进行测试。我按照指南测试了Java最终类，但仍然出现此错误 Cannot subclass final class 有什么办
Java 最终 boolean 优化
考虑以下设置: // debugger class public class Debug { // setting public final static boolean DEBUG
Java 最终 setter/getter
给定以下类(class): public class SomeClass { private final int a; public SomeClass(int a) {
java - 最终 Spring Bean
This question already has answers here: What does “final” do if you place it before a variable?
Java:序列化外部(最终)字段
我有一个类PasswordEncryptor，它使用org.jasypt.util.password.StrongPasswordEncryptor作为其字段之一，因为我试图使应用程序“可集群”所有类
C# StreamReader 尝试/最终
我今天有一个关于 StreamReader 类的问题。具体使用文件名参数初始化此类例如: TextReader tr = new StreamReader(fileName); 显然，当此操作完成后，
Java 锁定和解锁的不同方法。如何尝试/最终？
我想弄清楚什么是使用带锁的 try/finally 的最佳方式。当我在同一个地方有 lock() 和 unlock() 时，我只使用 try/finally block 作为 JavaDoc还建议:
java - 最终 transient 字段和序列化
在 Java 中序列化后是否可以将 final transient 字段设置为任何非默认值？我的用例是一个缓存变量——这就是它是 transient 的原因。我还有一个习惯，就是制作不会改变的 Map
java - 最终 transient 字段的序列化/反序列化
在this问题说 final transient 字段在序列化后不能设置为任何非默认值。那么，为什么我为 aVar1 变量设置了 3，为 aVar3 变量设置了 s3？ import java.io.
f# - 使用“最终”工作流程时，缺少尾部调用优化是否会成为障碍？
在Xbox上进行开发时，我使用的是F#规范中最终工作流程的修改版。 Xbox上的.net框架似乎不支持尾部调用。因此，我必须在编译时禁用尾部调用优化。尽管起初看来这种限制会阻止在计算表达式中使用任何
assembly - 最终 assembly 手册指南和 list
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便
java - Android 中的 ArrayList 最终
我想让我的带有自定义对象的ArrayList成为最终对象，以便对象在设置后无法更改。我试图这样声明它: private final ArrayList XML = new ArrayList();
SQL Server try catch 最终
我有一个场景，我需要类似于 .NET 的 try-catch-finally block 的内容。在我的尝试中，我将创建一个#temp表，向其中插入数据并基于#temp处理其他数据集。先是CATC
java - Android、Butterknife、BindView、最终
对此可能有一个简单的答案，但尝试充分使用 Butterknife，将一些 findViewById 转换为 @BindViews，并注意到我无法在需要声明为 Final 的 View 上使用 Bind

首页

博学

6Ren·AI

商城

python mechanize find_link 找到最终匹配的链接