gpt4 book ai didi

python - XPath 选择元素的字符串值但
替换为换行符?

转载 作者:太空宇宙 更新时间:2023-11-04 04:52:18 24 4
gpt4 key购买 nike

是否可以调用 xpath normalize-space()在 html 上显示 <br> , <br/>作为新线? XPath 版本为 1.0

我们解析来自网站的文章。真实 HTML 代码示例:

<div id="someid">
<img src="https://habrastorage.org/webt/ej/ye/hp/ejyehp08ercmqzlhzh3um6mtukm.jpeg"><br>
<br>
Организовать удаленный доступ для сотрудников — задача прикладная. Решений на рынке немало, при этом, и подводных камней достаточно. Под катом рассказ о нашем «чемодане», который раскладывается быстро и удобно за 30 минут. Просьба не воспринимать это как рекламный BS, поскольку внутри реальная инструкция по применению.<a name="habracut"></a><br>
<br>
<a href="https://www.parallels.com/ru/products/ras/remote-application-server/">Parallels Remote Application Server</a> (RAS) — это комплексное средство для доставки виртуальных приложений и рабочих столов, позволяющее работать с приложениями и данными с любого устройства, в том числе мобильного. Мы понимаем, что такие решения хочется сначала протестировать в конкретных условиях, прежде чем принимать решение о покупке. <br>
<br>
</div>

问题不在于从站点中提取文本。问题是 normalize-space是删除所有标签包括 <br> .结果我们有一个长文本行。我需要带中断的文本行。

预期结果:

Организовать удаленный доступ для сотрудников — задача прикладная. Решений на рынке немало, при этом, и подводных камней достаточно. Под катом рассказ о нашем «чемодане», который раскладывается быстро и удобно за 30 минут. Просьба не воспринимать это как рекламный BS, поскольку внутри реальная инструкция по применению.

Parallels Remote Application Server(RAS) — это комплексное средство для доставки виртуальных приложений и рабочих столов, позволяющее работать с приложениями и данными с любого устройства, в том числе мобильного. Мы понимаем, что такие решения хочется сначала протестировать в конкретных условиях, прежде чем принимать решение о покупке.

最佳答案

这个 XPath 2.0 表达式,

string-join(
for $n in (//div[@id="someid"]//node()[self::br or self::text()])
return if (name($n)='br')
then codepoints-to-string(10)
else $n, '')

将加入目标 div 的所有文本节点后代的字符串,用换行符替换所有 br 元素。

关于python - XPath 选择元素的字符串值但 <br/> 替换为换行符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47931534/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com