xpath - XPath或XQuery排除仅包含列表的文章部分-6ren

xpath - XPath或XQuery排除仅包含列表的文章部分

转载作者：行者123 更新时间：2023-12-03 16:10:30

26

4

我正在尝试摘录文章的各个部分（简介，历史记录，概述...）。我正在寻找一个XPath来选择所有以标题开头并包含一些段落的部分。如果它们仅包含列表，则应将其丢弃。

例如：

<h2>Intro</h2>
<p> It has paragraph and should be extracted </p>
.....
<h2>References </h2>
<ul>...It has just list and should be discarded </ul>
<h2>...</h2>
....

如果不可能使用XPath，则XQuery也可以工作。
我尝试了以下XQuery

for $x in doc("test.xq")//h2
return
   <section>{$x/following-sibling::*[preceding-sibling::h2[1] is $x]}</section>

它根据需要选择各个部分，但是我无法对其施加条件（不仅限于 ul）。

最佳答案

您在另一个问题中提到这是在BaseX中，它支持XQuery 3.0 group by机制，因此如何处理：

for $x in doc("test.xq")//h2/following-sibling::*[not(self::h2)]
group by $hId := generate-id($x/preceding-sibling::h2[1])
return
  if ($x[not(self::ul)]) then
    <section>{($x/preceding-sibling::h2[1], $x)}</section>
  else ()

在这里，我首先找到我们要聚集在一起的所有非h2元素（根据您XML的结构，可能有一种更有效的方法），然后 group by表示每次“迭代” $x变量将是一个h2和下一个h2之间的非h2元素序列。然后， if条件检查该组中是否有至少一个不是 ul的元素。

关于xpath - XPath或XQuery排除仅包含列表的文章部分，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30710968/

26

4

0

文章推荐： c# - List 困惑

文章推荐： xpath - fn :sum error "cannot cast to xs:double"

文章推荐： xml - 如何根据属性选择具有条件的节点

typescript - A 部分部分 io-ts
我在使用 io-ts 时遇到一些问题。我发现它确实缺乏文档，我取得的大部分进展都是通过 GitHub issues 取得的。不，我不明白 HKT，所以没有帮助。基本上，我在其他地方创建一个类型，ty
java - 匹配完整文件正则表达式中的 A 部分，但不匹配 B 部分
我必须创建一个正则表达式来搜索整个文件，以找到与 Java XML 解析器的第一部分(但不是第二部分)的匹配项。这将用于防止某些 XXE 攻击。不幸的是，它确实必须是单个正则表达式，并且它确实需要搜索
c# - 部分/部分中的 asp.net mvs 部分？
我有一些简单的 Shared/_Header.cshtml 文件中的内容。 My Shared/_Layout.cshtml 通过调用插入该代码 @Html.Partial("_Header") 目前
java - Selenium 只执行循环的 if != null 部分，不运行循环的 "else if null "部分
我有一个 if-else 语句，其中: 条件 1:ID 匹配并且自动填充某些字段。然后 if 语句只填充其余字段条件 2:ID 不匹配，所有字段均为空白。 ELSE 语句将它们全部填充当我使条件
javascript - 无法在 JSFIDDLE 中使用滚动魔法(第 1 部分，共 2 部分)
我正在开发一个单页滚动网站。我正在尝试实现 ScrollMagic 并固定第一部分，以便网站的其余部分滚动到固定部分的顶部。我尝试创建一个 jsfiddle 来显示问题，但我似乎无法让 jsfiddl
javascript - 既然有

首页

博学

6Ren·AI

商城

xpath - XPath或XQuery排除仅包含列表的文章部分