gpt4 book ai didi

javascript - 使用正则表达式从文本中解析单词

转载 作者:行者123 更新时间:2023-11-30 11:01:49 26 4
gpt4 key购买 nike

我有一个包含

等元素的 HTML 页面
<li id="ctl00_rpPublication_ctl61_liPublication" data-pmid="19917728">
<li id="ctl00_rpPublication_ctl62_liPublication" data-pmid="19887554">
<li id="ctl00_rpPublication_ctl63_liPublication" data-pmid="19851314">

我知道我可以使用 HTML-Agility 解析页面,甚至可以循环查找 data-pmid 的索引,但我想尽可能使用 Regex 来完成此操作。我需要阅读文本页并以包含所有 data-pmid 值的逗号分隔字符串结尾。比如

value = 19917728,19887554,19851314

我可以对 data-pmid 进行模式匹配,但不知道如何获取双引号之间的值。

我想使用 Regex 的原因是我可以在各种地方使用代码,例如 vb.net 或 javascript。这是正则表达式的好用处吗?该页面可以有 100 个值。

最佳答案

你可以做

let data = `<li id="ctl00_rpPublication_ctl61_liPublication" data-pmid="19917728">
<li id="ctl00_rpPublication_ctl62_liPublication" data-pmid="19887554">
<li id="ctl00_rpPublication_ctl63_liPublication" data-pmid="19851314">`;

let rx = /data-pmid="([^"]+)"/g;

match = rx.exec(data);
while (match != null) {
// matched text: match[0]
// match start: match.index
// capturing group n: match[n]
console.log(match[1])
match = rx.exec(data);
}

关于javascript - 使用正则表达式从文本中解析单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57435684/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com