gpt4 book ai didi

html - 不包含某些值的所有元素文本的XPath

转载 作者:行者123 更新时间:2023-12-03 17:03:14 26 4
gpt4 key购买 nike

我具有以下HTML结构,其中包含很少的电子邮件列表,并且我想获取用于处理电子邮件业务的电子邮件,而不是yahoo,gmail,hotmail等

<a href="#1">some@yahoo.com</a>
<a href="#2">s0m3@ymail.com</a>
<a href="#5">mail@yourbusiness.com</a>
<a href="#3">you@gmail.com</a>
<a href="#6">this@mybusinessmail.co.uk</a>
<a href="#4">me@hotmail.com</a>


所以我想要的是

mail@yourbusiness.com
this@mybusinessmail.co.uk


我的主意是

get A tag which NOT contain ymail AND NOT contain yahoo AND NOT contain gmail, AND NOT contain hotmail


但是如何根据上述想法编写XPath语法?

最佳答案

您可以使用substring-aftersubstring-before来获取@之后和first之前的部分。结合notcontains

因此,substring-before(substring-after(text(),"@"),'.')将获得域的第一部分,而//a[not(contains("ymail yahoo gmail hotmail", ...))]将排除您想要的部分。



//a[not(contains("ymail yahoo gmail hotmail", substring-before(substring-after(text(),"@"),'.')))]

关于html - 不包含某些值的所有元素文本的XPath,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31362650/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com