gpt4 book ai didi

python - 我如何使用 lxml 解析带有表单的结果页面?

转载 作者:行者123 更新时间:2023-12-01 06:15:12 25 4
gpt4 key购买 nike

我尝试使用 form 解析辅助页面。我使用此链接中的示例代码源: http://blog.ianbicking.org/2007/09/24/lxmlhtml/在我的测试中,我使用这个网址:http://www.infofer.ro/就像示例一样,我使用这个值:

>>> pprint(form.form_values())
[('cboData', '8/30/2010'),
('txtPlecare', 'Bucuresti Nord'),
('txtSosire', 'Constanta'),
('tip', 'GO'),
('lng', '1')]

结果是这样的:

result = parse(submit_form(form)).getroot()

这是另一个带有另一种形式的页面。我尝试这样的事情:

>>> page2=parse(result).getroot()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/python2.6/site-packages/lxml/html/__init__.py", line 661, in parse
return etree.parse(filename_or_url, parser, base_url=base_url, **kw)
File "lxml.etree.pyx", line 2706, in lxml.etree.parse (src/lxml/lxml.etree.c:49945)
File "parser.pxi", line 1525, in lxml.etree._parseDocument (src/lxml/lxml.etree.c:72026)
TypeError: cannot parse from 'HtmlElement'

我如何从辅助页面解析表单?

问候。

最佳答案

getroot 方法不会为您提供另一个“页面”,而是一个 lxml.html.HtmlElement 的实例。

没有必要(也没有办法)再次解析这个,您已经将需要的所有内容打包到result变量中。

关于python - 我如何使用 lxml 解析带有表单的结果页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3601222/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com