gpt4 book ai didi

java - 用Java解析HTML

转载 作者:行者123 更新时间:2023-12-02 04:45:31 28 4
gpt4 key购买 nike

我需要使用 Java 解析 HTML 页面以检索一些数据。

例如,来自传入.html

<html>
<head>
<title>TITLE</title>
<meta name="some name" content="some content" />
<link type=".." title=".." rel=".." href="link" />
<script type="text/javascript">..</script>
</head>
<body>
<!--googleoff:all-->
<img src="image.jpg"/>
<div class="div1"></div>
<div class="Logo"><a href="/"><img src="logo.png"/></a></div>
<div class="div2"></div>
<ul>
<li class=".."><a href="/”>a</a></li>
<li class=".."><a href="/”>b</a></li>
</ul>

<div class="div1"></div>
<div class="Logo"><a href="/"><img src="other.png"/></a></div>
<div class=”div2”></div>

<ul>
<li class=".."><a href="/”>a</a></li>
<li class=".."><a href="/”>b</a></li>
</ul>
<!--googleon:all-->
</body>
</html>

我需要接收outcoming.html

<html>
<head>
<title>TITLE</title>
<meta name="some name" content="some content" />
<link type=".." title=".." rel=".." href="link" />
<script type="text/javascript">..</script>
</head>
<body>
<div class="Logo"><a href="/"><img src="other.png"/></a></div>
<div class=”div2”></div>
</body>
</html>

问题的目的:

如何从两个仅内容不同的 equals 标签中进行选择。

就我而言,我有两个标签:

<div class="Logo"><a href="/"><img src="logo.png"/></a></div>

<div class="Logo"><a href="/"><img src="other.png"/></a></div>

但我只需要标签 src="other.png"

您认为最好的方法是什么?

最佳答案

您可以使用 JSoup 库。

这是链接http://jsoup.org/

使用起来非常简单。这是一个简单的例子。

String html = "<div><p>Lorem ipsum.</p>";
Document doc = Jsoup.parseBodyFragment(html);
Element body = doc.body();

关于java - 用Java解析HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29702237/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com