gpt4 book ai didi

python - 如何使用 lxml 获取斜体和非斜体文本

转载 作者:太空宇宙 更新时间:2023-11-03 14:31:51 25 4
gpt4 key购买 nike

我对表格中的每一行使用此命令,但我只得到非斜体的文本。

name = ''.join(row.xpath('td[3]/a/text()'))

a元素在 <em> </em 中有一些文本标签。

<td class="cardname"><a href="http://www.mtgotraders.com/store/PRM_Ball_Lightning_f.html"><em>Ball</em> <em>Lightning</em> *Foil*</a></td>

我想要Ball Lightning *Foil*

最佳答案

这是你想要的吗?无论您使用 xpath 还是 css 选择器,结果总是相同的。尝试一下:

html_content='''
<td class="cardname"><a href="http://www.mtgotraders.com/store/PRM_Ball_Lightning_f.html">
<em>Ball</em> <em>Lightning</em> *Foil*</a></td>
'''
from lxml.html import fromstring

root = fromstring(html_content)
item = root.cssselect(".cardname a")[0].text_content().strip()
item_alternative = root.xpath("//*[@class='cardname']/a")[0].text_content().strip()

print(item)
print(item_alternative)

结果:

Ball Lightning *Foil*
Ball Lightning *Foil*

关于python - 如何使用 lxml 获取斜体和非斜体文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47219325/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com