>> doc = fromstring(s) >>> doc.val-6ren">
gpt4 book ai didi

python-3.4 - lxml.html 的 href 属性

转载 作者:行者123 更新时间:2023-12-01 11:35:47 24 4
gpt4 key购买 nike

根据这个answer :

>>> from lxml.html import fromstring
>>> s = """<input type="hidden" name="question" value="1234">"""
>>> doc = fromstring(s)
>>> doc.value
'1234'
>>> doc.name
'question'

我试图从这段代码中获取链接和文本:
from lxml.html import fromstring
s = '<a href="http://a.com" rel="bookmark">bla bla bla</a>'
doc = fromstring(s)
print (doc.href)
print (doc.text_content())

它给出了 AttributeError:'HtmlElement' object has no attribute 'href'
我是 lxml 的新手。其实是什么问题?

我如何将链接(a.com)和文本(bla bla bla)都作为此代码中的字符串?

最佳答案

这段代码对我有用

from lxml.html import document_fromstring
doc = document_fromstring('<a href="http://a.com" rel="bookmark">bla bla bla</a>')
print (doc.xpath("//a")[0].get("href"))
print (doc.text_content())

输出:
http://a.com
bla bla bla

关于python-3.4 - lxml.html 的 href 属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27345122/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com