gpt4 book ai didi

java - 提取隐藏在 DIV id 下的值

转载 作者:行者123 更新时间:2023-11-30 02:52:57 25 4
gpt4 key购买 nike

Java 专家您好, 我试图从给定的 URL 地址中提取数据,其中信息隐藏在“div id”下。我的 URL 查询页面如下所示:

我将肽序列作为查询,然后单击“搜索数据集”按钮以表格形式查看结果。

但是当我尝试“查看页面源代码”以 HTML 形式查看结果时,我没有看到该表格。

使用“firebug”后,我可以在 HTML 中看到该表格,如下所示:

[![在此处输入图像描述][2]][2]

为了获取查询数据,我编写了简单的 JAVA 脚本:

package retrieve.information;
import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class DemoExtractHidenHtml {
public static void main(String[] args) {
Document document;
try {
document = Jsoup.connect("http://example.com/xyz_proxi.jsp#{\"searched_button\":\"datasets\",\"peptide\":\"NLAVSQVVHK\"}").userAgent("Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.21 (KHTML, like Gecko) Chrome/19.0.1042.0 Safari/535.21").get();
Element dataset = document.select("td.table[datasets]_row[0]_column[1]").first();
System.out.println(dataset);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}

}

}

当然它对我不起作用,我收到以下错误:

Exception in thread "main" org.jsoup.select.Selector$SelectorParseException: Could not parse query 'td.table[datasets]_row[0]_column[1]': unexpected token at '_row[0]_column[1]'
at org.jsoup.select.QueryParser.findElements(QueryParser.java:196)
at org.jsoup.select.QueryParser.parse(QueryParser.java:65)
at org.jsoup.select.QueryParser.parse(QueryParser.java:39)
at org.jsoup.select.Selector.<init>(Selector.java:84)
at org.jsoup.select.Selector.select(Selector.java:106)
at org.jsoup.nodes.Element.select(Element.java:286)
at retrieve.information.DemoExtractHidenHtml.main(DemoExtractHidenHtml.java:14)

任何人都知道如何克服这个问题,我是 JAVA 新手。

最佳答案

如果您可以在 Firebug 中看到该表,则复制其选择器(CSS 路径)并按如下方式使用

document.select(selector_str);
document.select("#rso > div > div:nth-child(1) > div > h3 > a");

关于java - 提取隐藏在 DIV id 下的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38087466/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com