gpt4 book ai didi

javascript - 您知道开源 Javascript 提取/正则表达式引擎吗?

转载 作者:行者123 更新时间:2023-11-28 21:01:46 33 4
gpt4 key购买 nike

我们需要一个 DOM 解析器,它能够运行一堆模式并存储结果。为此,我们正在寻找开放的库,我们可以开始,

  • 能够通过正则表达式选择元素(例如抓取类、id、元属性等其他属性中包含“价格”的所有元素),
  • 应该有很多帮助器,例如:删除评论、iframe 等
  • 而且要相当快。
  • 可以从浏览器扩展程序运行。

最佳答案

好吧,我会说:
您可以使用jQuery

上升:

  • 这是一个非常好的 dom 解析器
  • 它非常擅长操作 dom(删除/添加/编辑元素)
  • 它有一个很棒且直观的 API
  • 它有一个庞大而优秀的社区 => 对于任何 jquery 相关问题都有很多答案
  • 它适用于浏览器扩展(我自己在 chrome 中测试过,它显然也适用于 ff 扩展:How to use jQuery in Firefox Extension)
  • 它是轻量级的(大小约为 31KB - 缩小并压缩)
  • 它是跨浏览器的
  • 它绝对是开源的

下降:

  • 它不依赖正则表达式(尽管这是一件非常好事 - 正如 dda 已经提到的),但正则表达式可用于过滤元素
  • 不知道它是否可以访问/操纵评论

这是一些 jquery 操作的示例:

// select all the iframe elements with the class advertisement 
// that have the word "porn" in their src attribute
$('iframe.advertisement[src*=porn]')
// filter the ones that contains the word "poney" in their title
// with the help of a regex
.filter(function(){
return /poney/gi.test((this.title || this.document.title).test()));
})
// and remove them
.remove()
// return to the whole match
.end()
// filter them again, this time
// affect only the big ones
.filter(function(){
return $(this).width() > 100 && $(this).height() > 100;
})
// replace them with some html markup
.replaceWith('<img src="harmless_bunnies_and_kitties.jpg" />');

关于javascript - 您知道开源 Javascript 提取/正则表达式引擎吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10821899/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com