gpt4 book ai didi

c# - xpath搜索多个关键字

转载 作者:行者123 更新时间:2023-12-02 09:44:43 27 4
gpt4 key购买 nike

我正在使用 htmlagilitypack 和 xpath 来抓取网页中的特定关键字。我在一次搜索多个关键字时遇到了麻烦。

所以我得到的关键字内容的代码是(随机选择的关键字:Frozen 和 obamacare):

HtmlDocument doc = new HtmlDocument();
HtmlWeb web = new HtmlWeb();
doc = web.Load(uri);
HtmlNodeCollection Nodes = doc.DocumentNode.SelectNodes("//text()[contains(., 'Frozen obamacare')]");

即使我知道该页面特别具有两个关键字,并且从其他发现中基本上得知 SelectNodes("//text()[contains(., 'Frozen obamacare')] "); 是多个关键字的正确方式。

我需要帮助验证这是否是使用多个关键字的正确方法,如果不是,那么我正在寻求帮助来纠正它。

最佳答案

这将检索包含字符串“Frozen obamacare”的所有文本节点。它不会标记为单词或任何东西。与您的查询匹配的示例是:

  • 冷冻奥巴马医改
  • fooFrozen obamacarebar

它不匹配:

  • 冷冻 foo obamacare
  • 冷冻奥巴马医改
  • 等等

要匹配 XPath 1.0 中包含两个标记的字符串,请使用

//text()[contains(., 'Frozen') and contains(., 'obamacare')]

HTML Agility Pack 仅支持 XPath 1.0,因此您无法使用 XPath 2.0 的更高级标记化功能。

关于c# - xpath搜索多个关键字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22767900/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com