gpt4 book ai didi

java - 如何使用java从新闻文章中提取发布时间和文章内容?

转载 作者:行者123 更新时间:2023-11-30 04:27:23 25 4
gpt4 key购买 nike

我必须从新闻链接中提取发布时间和文章内容。

例如:从此链接 http://techcrunch.com/2013/03/19/jawbone-android/

我必须将发布时间和文章内容提取为

发布时间:昨天发布

文章内容:Jawbone 今天宣布,该公司的运动追踪腕带 UP 应用程序现已可在 Google Play 上免费下载 Android 版。 129 美元的 UP 此前仅与 iOS 兼容。腕带现在也可以购买了……

最佳答案

我认为你可以使用jsoup

http://jsoup.org/

jsoup 是一个用于处理实际 HTML 的 Java 库。它使用最好的 DOM、CSS 和类似 jquery 的方法,提供了一个非常方便的 API 来提取和操作数据。

关于java - 如何使用java从新闻文章中提取发布时间和文章内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15520621/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com