gpt4 book ai didi

python - xpath 按
标签分割字符串

转载 作者:行者123 更新时间:2023-11-30 23:17:59 26 4
gpt4 key购买 nike

我在使用 python 和 Scrappy 库时遇到问题。当这段代码:

self.item['char_SP4_TIP'] = response.xpath('//p[contains(@class, "spell-tooltip")]/text()').extract()

运行,它从段落中提取文本,但将其按 <br> tags 分割。 。

因此,不能像这样访问它: self.item['char_SP4_TIP'][0] ,我必须访问[0][1][2]等等..无论多少<br>标签有。有什么办法可以修复它,这样它就不会被 <br> 分割吗?标签?谢谢。

最佳答案

您的 xpath 选择所有文本节点,但 <br>不是文本节点。

<p class='spell-description'> blah <br><br> blah2 </p>
Selects these ^^^^ ^^^^^

您可以join分割文本。

texts = response.xpath('//p[contains(@class, "spell-tooltip")]/text()').extract()
text = '\n'.join(texts)

如果有多个<p>该类的标签:

text = ['\n'.join(p.xpath('/text()').extract()) 
for p in response.xpath('//p[contains(@class, "spell-tooltip")]')]

关于python - xpath 按 <br> 标签分割字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27008662/

26 4 0