- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在服务器端 JavaScript 中解析一些 XML。 XML 通过调用另一台服务器返回。我正在使用在 With regex how do i match between an XML tag multiple times? 找到的解决方案的修改版本并使用测试仪在 http://www.regular-expressions.info/javascriptexample.html 测试了 RegExp .
返回了大约 1280 条记录,并且几乎一直有效。但今天我注意到大约 30 条记录无法正确解析。有些字段在解析时最终为空,我不明白为什么。
我在循环中创建的正则表达式示例是
<field name="URL_ProProfs"><data>(.+?)<\/data><\/field>
我正在解析的记录示例是
<record mod-id="439" record-id="6640">
<field name="Name">
<data>Inviting Young Children to Explore Process Art</data>
</field>
<field name="Byline_Presenter">
<data> Presented by MaryAnn F. Kohl, Author, Educator, and Presenter </data>
</field>
<field name="Date">
<data>11/14/2016</data>
</field>
<field name="URL_On_Demand">
<data> https://www.anymeeting.com/843-066-411/E954DB85814B38 </data>
</field>
<field name="URL_ProProfs">
<data> https://www.proprofs.com/quiz-school/story.php?title=quiz-18-classroommanagementwebinar20161114_3WO </data>
</field>
<field name="Status">
<data>1</data>
</field>
<field name="URL_Blog">
<data> http://home.edweb.net/webinar/young-children-explore-process-art/ </data>
</field>
<field name="Channel_1">
<data>Arts in Education</data>
</field>
<field name="Channel_2">
<data>Early Childhood Learning</data>
</field>
<field name="Channel_3">
<data/>
</field>
<field name="Channel_4">
<data/>
</field>
<field name="Name_Community">
<data>classroommanagement</data>
</field>
<field name="Webinars_COMMUNITIES::Name_Long">
<data>Classroom Management for Early Learning</data>
</field>
<field name="_ID_Community">
<data>.5a1dcfde</data>
</field>
</record>
如果我在测试器上使用带有该字符串的 RegExp,它会正确解析,并且我能够找到该字段的返回值作为 .exec 数组结果的第二个元素:
https://www.proprofs.com/quiz-school/story.php?title=quiz-18-classroommanagementwebinar20161114_3WO
但有时,由于某些我无法理解的原因,我会为我正在解析的不同字段返回空值。在本例中,对于字段 URL_ProfProps。
我正在使用以下循环对 RegExp 执行 exec 以查找记录中的所有值。每个记录都会调用该函数本身。
function webinarParse(record) {
var r = new Object();
var fields = ["Name", "Byline_Presenter", "Date", "URL_On_Demand", "URL_Blog", "URL_ProProfs", "Name_Community", "Webinars_COMMUNITIES::Name_Long", "Channel_1",
"Channel_2", "Channel_3", "Channel_4", "_ID_Community"];
for (f=0; f<fields.length; f++) {
var re = new RegExp('<field name="' + fields[f] + '"><data>(.+?)<\/data><\/field>');
var m = re.exec(record);
if (m == null) {
r[fields[f]] = "";
} else {
if (fields[f] == 'Date') {
r[fields[f]] = new Date(m[1]);
}
else {
if (m[1].indexOf('<data>') != -1) {
// greedy match captured from next field when there was no data present
r[fields[f]] = "";
}
else {
r[fields[f]] = m[1];
}
}
}
}
return r;
}
参数记录是我返回的所有 XML 记录中的一条记录。
Object() r 是我的返回值。
Array() 字段是我正在解析的值列表。
在循环中,我为字段的每个元素创建一个新的 RegExp,以查看是否有可返回的值。
如果 re.exec(record) 为 null,我只需在 r 中为该属性设置一个空字符串。
如果该字段恰好是日期字符串,我会为该属性设置一个 Date 对象。
那么我必须小心,因为 XML 正在返回
<data />
如果没有数据,而不是
<data></data>
所以我检查了一下。也就是说,有数据就应该有
<data>
标签。如果没有,我不想抢太多。
我正在记录每条记录的解析,它在 1280 次中工作了大约 1250 次。但对于某些记录,其中一两个字段无法解析,即使我确认 XML 本身中有数据。
上面的示例似乎在测试器页面上正确解析,但在我的循环中,URL_ProPofs 的值返回空值。
对我的正则表达式或循环执行此操作有什么想法吗?我只是不明白为什么它有时找不到值(value)。
谢谢。
最佳答案
简短的回答:使用 XPath/XQuery 查询和访问 XML 文档中的数据,它将为您提供更大的灵 active 并摆脱特定情况,例如它们是为此目的而设计的。
对于正则表达式,'.'
不匹配新行,因此需要添加 \r
和\n
并且还为 <field...>
之间的任何内容添加匹配和<data...>
以及 </data>
之间和</field>
.
完成所有这些,你最终会得到像这样的正则表达式
<field name="URL_ProProfs">[\s\n\r]*?<data>((?:.|[\n\r])*?)<\/data>[\s\r\n]*?<\/field>
这是一个工作示例:https://regex101.com/r/07xgks/4但请记住,只有当数据中没有嵌套数据、xml 有效等等时,这才有效......
关于javascript - 使用 RegExp 和 exec 在 JavaScript 中解析 XML - 它通常可以工作,但在少数情况下却不能 - 知道为什么吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41439888/
时间过后如何用javascript或任何其他解释语言实现的函数被调用? 换句话说,在javascript解释器中是否存在循环,该循环始终检查计时器列表,或者操作系统是否有任何特定方式来处理此循环? 谢
我有项目要做。假设是这样的: 从带有单词的文件中,我只需要阅读字母单词(进入名为Words的列表-下面的代码)-我是使用lib中的isalpha()函数做到的。列表的每个元素包含一个单词 我需要从输入
我有两套test和 test1我需要从 test 中删除元素存在于 test1例如 如果test包含 1,2,3,4,5 和 test1包含 3,5,6,7:那么函数应该在 test 上执行所以里面只
引用指针导致间接使用对象的值。但我从来没有真正理解“使用”是什么意思。我开始思考这个问题,直到我的编译器对以下代码产生错误 int i = 0, *pi = &i; decltype(*pi) c;
我读了很多关于 Taint在 Perl 变量、模式等中,例如来自 docs : $AUTOLOAD can now be tainted If you call a subroutine by a t
我一直在研究 FP 语言(断断续续),并且使用过 Scala、Haskell、F# 和其他一些语言。我喜欢我所看到的并理解 FP 的一些基本概念(绝对没有范畴论的背景——所以请不要谈论数学)。 所以,
在C语言中,当您想要进行通用编程时,唯一受语言支持的选项是宏。它们效果很好并且被广泛使用,但是如果可以使用内联函数或常规函数,则不建议使用它们。 (如果使用gcc,您还可以使用gcc statemen
我有一些代码可以进行 requests.get() 调用,这可能会以各种方式失败。我想捕获 requests 异常,但不关心调用失败的原因。 我想避免这样的代码 try: r = reques
我正在尝试编写一个 C 解析器,用于我自己的教育。我知道我可以使用像 YACC 这样的工具来简化这个过程,但我想尽可能多地从经验中学习,所以我从头开始。 我的问题是我应该如何处理这样的一行: doSo
我正在设计一个系统,但我认为让最终用户能够删除数据库中的条目并不是一个好主意。我是这么认为的,因为通常最终用户一旦获得管理员权限,最终可能会在数据库中弄得一团糟,然后求助于我来修复它。 当然,如果他们
我们有两张 table 。第一个包含名称 (varchar) 字段。第二个包含引用第一个表中的名称字段的字段。第二个表中的外键将针对与该名称关联的每一行重复。通常不鼓励使用 varchar/strin
我正在为 Apple Watch 开发一个非常简单的锻炼应用程序。它使用 Health Kit 开始和结束锻炼,我唯一的问题是,当我尝试结束锻炼时,它通常不会结束 session ,我收到此错误 20
当前,我们在执行sql查询脚本时遇到一些失败的问题。 错误讯息为, ” 系统断言检查失败。检查SQL Server错误日志以获取详细信息。通常,断言失败是由软件错误或数据损坏引起的。要检查数据库是否损
这是一个非常简单的问题,但我似乎找不到在某些情况下选择一个而不是另一个的一般规则。 假设我有一个简单的 Point 类,如下所示: class Point { public: Point();
这个问题在这里已经有了答案: Java Programming - Where should SQL statements be stored? [closed] (15 个答案) 关闭 9 年前。
我很欣赏这个问题可能有点“基于意见”,但是,我认为一个概括的答案可以极大地帮助将来有兴趣了解更多关于 PWA 和 Service Workers 的其他人。 背景 我在网上搜索过,但很惊讶地发现没有明
对于编程语言解释器,我想知道解释器经历的事件顺序。例如,我认为事情是这样的: 解释器得到一些输入 词法分析器/分词器获取输入并划分标记 x 获取代币列表 ??? 代码被执行 什么步骤属于 ??? sp
我是 Flutter 的新手,刚刚从阅读有关 Flutter 的教程中听说了 BLoC 概念。从这里 tutorial ,第一次听说BLoC。但是我在这篇文章中也看到了一个名为“Repository”
我正在为下/上三角矩阵(double)编写一个类。通过利用 n*n 三角矩阵只有 n*(n + 1)/2 [可能非零] 元素这一事实,我在内部只存储平面数组成员中的元素数量。 首先,我有一个“普通”(
我有一个 Java src 文件夹,我在其中存储我的 .java 文件。然后我使用终端编译它们并最终在同一目录中获得 .class 文件。这不一定会打扰我,但我从未见过专业人士这样做。 按照专业惯例(
我是一名优秀的程序员,十分优秀!