gpt4 book ai didi

java - 使用Java将html部分打印成pdf

转载 作者:太空宇宙 更新时间:2023-11-04 12:05:07 24 4
gpt4 key购买 nike

社区!

我的元素很简单:我有一个网站链接,该网站包含关于不同化学物质的多种信息,我想提取一些数据并放入 pdf 中。事情是我想保留原始 HTML 的格式(当然使用它的 css)。物质示例:http://www.molbase.com/en/msds_1659-31-0-moldata-2.html#tabs

我使用 jsoup 读取了页面底部表格的 HTML,MSDS 包含多个部分,其中包含关于物质的不同信息,但我真的不知道如何将确切的 HTML 格式保存到我的pdf文件。我也尝试过使用 iText,但它给了我“缺少结束标记”错误,如果它有效,它会打印整页,而不仅仅是那个 msds 表。

这是我尝试做的,但没有效果:

Document docu = Jsoup.connect(urlbun).get();
Element tableHeader = docu.select("div[class=\"msds\"]")
.first();
String[] finSyn = tableHeader.text().split(" ");
String moreText =" ";

我试图拆分网页在该 div ("class = "msds"") 下的文本,但我找不到合适的拆分方法。

拜托,你能给我一个提示吗?即使格式不同,我也希望能够以相同的方式显示信息,包括缩进等。

谢谢!

最佳答案

您可以将要转换为 PDF 的内容放在 CSS ID(例如 DIV)中,然后使用 PDFmyURL API 仅将该部分转换为 PDF。

请引用本站about how to select pieces from a page to convert to PDF

披露:我为拥有该网站的公司工作

关于java - 使用Java将html部分打印成pdf,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29447701/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com