gpt4 book ai didi

java - Clojure 相当于 Python 的 lxml 库?

转载 作者:太空狗 更新时间:2023-10-29 18:04:15 26 4
gpt4 key购买 nike

我正在寻找与 Python 的 lxml 库等效的 Clojure/Java。

我过去经常使用它来解析各种 html(作为 BeautifulSoup 的替代品),而且能够对 xml 使用相同的 elementtree api 真是太棒了——真的是一个值得信赖的 friend !谁能推荐一个类似的 Java/Clojure 库?

关于lxml

lxml 是一个基于 libxml2 的 xml 和 html 处理库。它可以很好地处理损坏的 html 页面,因此非常适合屏幕抓取任务。它还实现了 ElementTree api,因此 xml/html 结构表示为树对象,完全支持 xpath 和 css 选择器等。

它还有一些非常方便的实用功能,例如“cleaner”模块,可以从“soup”中去除不需要的标签(即脚本标签、样式标签等)。

因此它使用简单、健壮且速度非常快...!

最佳答案

激活:http://github.com/cgrand/enlive

我已经将它用于屏幕抓取,并且效果非常好。它使用类似 CSS 选择器的语法来获取文档中的元素。

关于java - Clojure 相当于 Python 的 lxml 库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1569223/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com