gpt4 book ai didi

java - 蒂卡信息提取

转载 作者:行者123 更新时间:2023-12-01 05:11:32 25 4
gpt4 key购买 nike

我可以知道如何使用 Tika 提取网页中表格形式的数字等信息吗? Tika 有用于此目的的解析器吗?

谢谢

最佳答案

你可以在 tika 中提取网页。为此,您可以使用 apache-tika HTMLParser。您将获得所需的一切here

您还可以使用AutoDetectParser,它将自动检测内容类型并提取内容AutoDetectParser 可以检测任何类型的文件/url 并应用提取。

May I know how I can use Tika to extract information such as numbers in a tabular form in a web page?

--> tika 提取的内容就像原始文本。我认为您不会以表格形式得到它。

关于java - 蒂卡信息提取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11981658/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com