gpt4 book ai didi

java - 通过识别标签从 HTML 中获取信息

转载 作者:行者123 更新时间:2023-12-02 00:13:23 24 4
gpt4 key购买 nike

所有-我以前从未做过此类事情并且很困惑。我花了几个小时在 Google 上寻找一些示例代码或任何提示,但每当我尝试使用可用代码时,我总是会遇到错误,并且最终比开始时更加困惑。自怜和借口已经够多了。让我们回答这个问题:我有一个应用程序“屏幕 fragment ”网站,现在是谷歌。我已经得到了它,所以我可以在 TextView 中显示 html: enter image description here我现在的问题是从中获取信息。我想要的只是标题标签(“Google”)中的信息。我读过有关 HTML 解析的内容,但当我阅读 TagSoup 或其他类似信息时感到非常困惑。我是否需要这些来完成它,或者我可以编写一些 Java 代码来提取标题标签并将其放入字符串中然后显示它。如果我确实需要 HTML 解析器,有人可以给我一些示例代码吗?我在他们的网站上找不到任何内容。这是我到目前为止的代码:

public class MainActivity extends Activity {
String page;
String display;
Document doc;
@Override
public void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
new AddStringTask().execute();
}
@Override
public boolean onCreateOptionsMenu(Menu menu) {
getMenuInflater().inflate(R.menu.activity_main, menu);
return true;
}
class AddStringTask extends AsyncTask<Void, String, Void> {
@Override
protected Void doInBackground(Void... unused) {
DefaultHttpClient httpClient = new DefaultHttpClient();
HttpGet httpGet = new HttpGet("http://www.google.com");
ResponseHandler<String> resHandler = new BasicResponseHandler();
try {
page = httpClient.execute(httpGet, resHandler);
} catch (ClientProtocolException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return null;
}

@Override
protected void onProgressUpdate(String... item) {
}
@Override
protected void onPostExecute(Void unused) {
TextView google = (TextView) findViewById(R.id.google);
google.setText(page);
}
}
}

任何示例代码都会很棒,因为我需要查看一些示例。非常感谢您的宝贵时间。

最佳答案

jsoup: Java HTML Parser应该可以解决这个问题:

Document doc = Jsoup.connect("http://google.com/").get();
String docTitle = doc.title();

然后将 docTitle 传递给 google.setText()

您可以找到更多示例here .

关于java - 通过识别标签从 HTML 中获取信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12344028/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com