gpt4 book ai didi

android - 如何从 HTML 中提取内容

转载 作者:行者123 更新时间:2023-11-28 05:26:49 25 4
gpt4 key购买 nike

我有 HTML 作为字符串,我只想从中提取“post_titles”。这是 HTML 字符串:

<div class="hidden" id="inline_49">
<div class="post_title">Single parenting</div>
<div class="post_name">single-parenting</div>
<div class="post_author">90307285</div>
<div class="comment_status">open</div>
<div class="ping_status">open</div>
<div class="_status">publish</div>
<div class="jj">20</div>
<div class="mm">07</div>
<div class="aa">2015</div>
<div class="hh">00</div>
<div class="mn">52</div>
<div class="ss">33</div>

这篇文章的标题是“单亲育儿”,这是我想提取的内容。这就是我正在使用的:

Elements link = doc.select("div[class=post_title]");
String title = link.text();

但这是给出一个空字符串。我也试过:

Elements link = doc.select("div[id=inline_49]").select("div[class=post_title]");
String title = link.text();

这也给出了一个空白字符串。请帮助我究竟需要使用什么选择器来提取标题。

最佳答案

您必须在您的请求中包含一个 cookie。检查此 Java 代码:

try {

String url = "https://ssblecturate.wordpress.com/wp-login.php";

Connection.Response response = Jsoup.connect(url)
.data("log", "your_login_here") // your wordpress login
.data("pwd", "your_password_here") // your wordpress password
.data("rememberme", "forever")
.data("wp-submit", "Log In")
.method(Connection.Method.POST)
.followRedirects(true)
.execute();

Document document = Jsoup.connect("https://ssblecturate.wordpress.com/wp-admin/edit.php")
.cookies(response.cookies())
.get();

Element titleElement= document.select("div[class=post_title]").first();
System.out.println(titleElement.text());

} catch (IOException e) {
e.printStackTrace();
}

关于android - 如何从 HTML 中提取内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31520799/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com