gpt4 book ai didi

xpath - html-agility-pack提取背景图片

转载 作者:行者123 更新时间:2023-12-03 16:05:21 25 4
gpt4 key购买 nike

如何从以下HTML中提取网址。

即提取

http://media.somesite.com.au/img-101x76.jpg


从:

<div class="media-img">
<div class=" searched-img" style="background-image: url(http://media.somesite.com.au/img-101x76.jpg);"></div>
</div>

最佳答案

通常,在XPath 1.0中,可以结合使用substring-after()substring-before()函数来提取文本的一部分。但是HAP的SelectNodes()SelectSingleNode()除了节点以外不能返回,因此这些XPath函数将无济于事。

一种可能的方法是使用XPath和HAP获取style属性的完整值,然后使用regex从.NET进一步处理该值,例如:

var html = @"<div class='media-img'>
<div class=' searched-img' style='background-image: url(http://media.somesite.com.au/img-101x76.jpg);'></div>
</div>";
var doc = new HtmlDocument();
doc.LoadHtml(html);
var div = doc.DocumentNode.SelectSingleNode("//div[contains(@class,'searched-img')]");
var url = Regex.Match(div.GetAttributeValue("style", ""), @"(?<=url\()(.*)(?=\))").Groups[1].Value;
Console.WriteLine(url);


.NET Fiddle Demo

输出:

http://media.somesite.com.au/img-101x76.jpg

关于xpath - html-agility-pack提取背景图片,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31098442/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com