gpt4 book ai didi

java - 在 DIV HTML 中遍历或查找元素的最快方法

转载 作者:行者123 更新时间:2023-11-28 12:45:08 29 4
gpt4 key购买 nike

我正在编写一个实用程序,它应该访问动态页面的 URL、检索内容、在各种嵌套 div 标签中搜索特定的 div 标签并获取内容。

主要是,我正在寻找一些Java代码/库。 JavaScript 或一些基于 JavaScript 的库也适合我。

我入围以下 -> JSoup、Jerry、JTidy(最后更新于 2009 年 12 月 1 日)。哪一个性能最好?

编辑:重新表述问题。添加了入围库。

最佳答案

如果你想抓取页面并解析它,我建议使用带有 jsdom 的节点。

安装nodeJS(假设是linux):

sudo apt-get install git
cd ~
git clone git://github.com/joyent/node
cd node
git checkout v0.6
mkdir ~/.local # If it doesn't already exist
./configure --prefix=~/.local
make
make install

还有一个 Windows 安装程序:http://nodejs.org/dist/v0.6.6/node-v0.6.6.msi

安装jsdom:

$ npm install jsdom

运行使用您的网址和相关选择器修改的脚本:

var jsdom = require('jsdom');

jsdom.env({
html: 'url',
done: function(errors, window) {
console.log(window.document.getElementById('foo').textContent;
}
});

关于java - 在 DIV HTML 中遍历或查找元素的最快方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8614066/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com