java - 使用 iText 将 HTML 转换为 PDF 时出错-6ren

java - 使用 iText 将 HTML 转换为 PDF 时出错

转载作者：行者123 更新时间：2023-11-30 05:04:05

24

4

我正在尝试从 HTML 文档生成 PDF 文件。

HTML 文件格式正确且没有错误。我使用 HtmlCleaner 来清理代码，因此它适合使用 iText 创建 PDF 文件。

这是我在 HTML 示例中使用的代码。

import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.StringReader;
import java.io.UnsupportedEncodingException;

import com.itextpdf.text.DocumentException;
import com.itextpdf.text.PageSize;
import com.itextpdf.text.html.simpleparser.HTMLWorker;
import com.itextpdf.text.pdf.PdfWriter;


public class pdfIng {

    /**
     * @param args
     */
    public static void main(String[] args) {
        // TODO Auto-generated method stub
        try {

            com.itextpdf.text.Document document = new com.itextpdf.text.Document(PageSize.A4);
            PdfWriter pdfWriter = PdfWriter.getInstance(document, new FileOutputStream("D://testpdf.pdf"));
            document.open();
            document.addAuthor("Author of the Doc");
            document.addCreator("Creator of the Doc");
            document.addSubject("Subject of the Doc");
            document.addCreationDate();
            document.addTitle("This is the title");

            //SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
            //SAXmyHtmlHandler shh = new SAXmyHtmlHandler(document);

            HTMLWorker htmlWorker = new HTMLWorker(document);
            String str = "<?xml version=\"1.0\" encoding=\"utf-8\"?>"+ " <html> <head />    <body>      " +
                    "<h2>Text</h2>  " +
                    "   Here, you will learn how to retrieve all rows from a " +
                    "database table. You know that table contains the data in " +
                    "rows and columns format. If you want to access the data from" +
                    " a table then you need to use some APIs and methods. See brief " +
                    "descriptions for retrieving all rows from a database table as below:   " +
                    "   Description of program:     Program establishes the connection " +
                    "between MySQL database and java file so that the we can retrieve " +
                    "all data from a specific database table. If any exception occurs " +
                    "then shows a message SQL code does not execute.        " +
                    "<br />     <br />      <hr />      <br />      " +
                    "<b>Name</b>        " +
                    "AAAAAA AAAAAAAAA       <br />      <b>Date   :" +
                    "</b>       17/04/2011 00:31:18     <br />      <b>Text:" +
                    "</b>       <br />      gggggggggggggg      <br />      <br />  " +
                    "           <br />      " +
                    "<br />     <b>Name</b> " +
                    "   BBBBBB BBBBBBBBB        <br />      <b>Date   " +
                    ":</b>      17/04/2011 00:35:37     <br />      <b>Text:</b>" +
                    "       <br />      gftgfgfgfgfgggfgf        gggggg" +
                    "       <br />      <br />          " +
                    "   <br />      <br />      <b>Name</b>     " +
                    "DDDDDD DDDDDDDDD       <br />      <b>Date   :</b> " +
                    "   16/04/2011 22:28:28     <br />      <b>Text:</b>        " +
                    "<br />     w tawa!     <br />      <br />       " +
                    "       <br />      <br />      <b>Name</b>     " +
                    "CCCCCC CCCCCCCCC       <br />      <b>Date   :</b>     " +
                    "16/04/2011 22:37:08        <br />      <b>Text:</b>        " +
                    "<br />     ched tawa!!!        <br />      <br />      " +
                    "       <br />  " +
                    "   <br />      <b>Name</b>     " +
                    "BBBBBB BBBBBBBBB       <br />      <b>Date   :</b> " +
                    "   16/04/2011 22:37:26     <br />      <b>Text:</b>        " +
                    "<br />     okiiiiii!       <br />      <br />  " +
                    "       " +
                    "   <br />      <br />      <b>Name</b> " +
                    "   AAAAAA AAAAAAAAA        <br />      <b>Date   :</b> " +
                    "   17/04/2011 02:41:14     <br />      <b>Text:</b>    " +
                    "   <br />              cava hakka??    " +
                    "   <br />      <br />          " +
                    "   <br />  </body></html> ";
            System.out.println(str);
            htmlWorker.parse(new StringReader(str));

            document.close();

            } catch(DocumentException e) {
            e.printStackTrace();
            } catch (FileNotFoundException e) {
            e.printStackTrace();
            } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
            } catch (IOException e) {
            e.printStackTrace();
            }
    }

}

和输出

Exception in thread "main" java.lang.NullPointerException
    at com.itextpdf.text.html.simpleparser.HTMLWorker.createLineSeparator(HTMLWorker.java:435)
    at com.itextpdf.text.html.simpleparser.HTMLTagProcessors$5.startElement(HTMLTagProcessors.java:208)
    at com.itextpdf.text.html.simpleparser.HTMLWorker.startElement(HTMLWorker.java:189)
    at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.processTag(SimpleXMLParser.java:566)
    at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.go(SimpleXMLParser.java:340)
    at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.parse(SimpleXMLParser.java:592)
    at com.itextpdf.text.html.simpleparser.HTMLWorker.parse(HTMLWorker.java:143)
    at pdfIng.main(pdfIng.java:78)

我一开始以为这行"<?xml version=\"1.0\" encoding=\"utf-8\"?>"导致错误，但事实并非如此。

我在 str 字符串中搜索了是否有导致错误的字符，但在我看来所有单词都是正常且健康的，我无法消除任何一个。

预先感谢您的帮助! :)

最佳答案

我发现错误了!这是HR标签!!在 iText 网站上我发现了这个:

删除旧的类/功能；这可能会导致您的应用程序崩溃，但您不应该使用任何这些过时的类，因此这些问题很可能不会出现问题。如果您确实遇到问题，请按照以下说明操作:

class Graphic:如果您仍在使用它:请使用直接内容和/或 PdfTemplate。待办事项:the <hr> tag doesn't work anymore in the XML parser .

所以我必须找到其他东西来代替 HR 标签!

关于java - 使用 iText 将 HTML 转换为 PDF 时出错，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5703578/

24

4

0

文章推荐： android - cursor.moveToNext() 抛出 CursorWindowAllocationException

文章推荐： c++ - 如何创建 Eigen::Ref vector

文章推荐： android - 与设备相比，我在 android 中的布局预览显示不同

文章推荐： c++ - 为 Raspberry PI 交叉编译 QT static 时只有 eglfs

itext - iText 包含哪些默认字体？
iText 文档指出它只包含特定的字体子集，但从未说明它们是什么。有没有人知道 iText 中默认包含哪些字体？ (我在网上搜索过，在任何地方都找不到这个字体列表!) 最佳答案它可能指的是PDF S
itext - IText 7 表格中的列宽问题
我使用固定列宽创建了下表，如下所示， Table headerTable = new Table(new float[]{5,5,5}); headerTable.setWidthPercent(
itext - 缩放图像以使用 iText 填充多个页面
我正在尝试使用 iText 缩放图像(在新的 PDF 文档上)以使其填充页面宽度而不拉伸(stretch)，这样它可能需要几页。我找到了很多解决方案，但它们都非常复杂，而且我真的不喜欢那样编码。到目
itext - Flying Saucer/iText
我正在使用 Flying Saucer/iText 生成报告。现在报告有一个条件，如果特定条件发生，报告应该移动到 pdf 的下一页，并在 PDF 上添加数据等等。问候帕万最佳答案您必须使用 c
itext - Flying Saucer/iText
我正在使用 Flying Saucer/iText 生成报告。现在报告有一个条件，如果特定条件发生，报告应该移动到 pdf 的下一页，并在 PDF 上添加数据等等。问候帕万最佳答案您必须使用 c
itext - 使用 iText 获取行位置
如何使用 iText 找到文档中的行的位置？假设我有一个 PDF 文档中的表格，并且想要阅读其中的内容；我想找到细胞的确切位置。为了做到这一点，我想我可能会找到线条的交点。最佳答案我认为您使用
itext - 使具有带有 itext 的滚动条的表的可编辑单元格只读
请找到下面的代码。 public class MakingFieldReadOnly implements PdfPCellEvent { /** The resulting PDF. */
itext - 在 iText 7 中编写文档时如何获得垂直光标位置？
在 iText 5 中有一个名为 getVerticalPosition() 的方法，它给出了下一个写入对象在页面上的位置。作为回答这个问题 How to find out the current c
itext - 在 TextField IText 中调整文本
抱歉，如果有类似我的帖子，但我是这个论坛的新手，我还没有找到它。我有动态调整 TextField 大小取决于文本大小的问题。我填写现有的 PDF - 在 AcroForm 中填写字段: form.s
itext - 要知道它是否是 ITEXT pdf 中的新页面
我正在使用 itext 生成 pdf。因此，当页面内容超出时，它会自动创建一个新页面。我想知道它是否创建了一个新页面。如果是，我想在页面顶部添加一些图像。 List paylist =new List
itext - 删除表格 iText java 的左右边距
我的有问题固定表格左侧和右侧的边距。我想删除该边距并使用没有边距或填充的所有工作表。我该怎么办？我刚刚试过这个，但对我不起作用: cell.setPaddingLeft(0); cell.se
itext - 如何使用 Itext 对齐段落(对齐)？
我有 2 行，我想对齐(证明)它们。我有这个代码: Paragraph p=new Paragraph(ANC,fontFootData); p.setLeading(1, 1);
itext - 使用外部服务和 iText 签署 PDF
我有这样的场景。我有一个生成 PDF 的应用程序，需要对其进行签名。我们没有用于签署文档的证书，因为它们位于 HSM 中，而我们使用证书的唯一方法是使用 Web 服务。此网络服务提供两个选项，发
itext - 如何实现 itext 7 表中列之间的空间？
我需要实现一个看起来像图片中的表格，列之间有空间。我试过: cell.setPaddingLeft(10); cell.setMarginLeft(10); extractio
itext - 如何实现 itext 7 表中列之间的空间？
我需要实现一个看起来像图片中的表格，列之间有空间。我试过: cell.setPaddingLeft(10); cell.setMarginLeft(10); extractio
itext - 使用 iText 将复选框添加到 PDF 文档
我需要使用 Java 的 iText 库创建一个 PDF 文档。我还需要包括一些复选框，这些复选框根据某些类变量的值打开/关闭。我找到了一些关于交互式表单的示例，但我不需要这种复杂程度:只需将一些复选
itext - 如何使用 iText PdfStamper 将内容添加到 PDF
我正在开发一个系统，我必须在其中将一些图像添加到现有的 PDF 文档中。这适用于 iText 5.1.3，但由于某种原因，在包含扫描图像的 PDF 中，它不会添加任何图像。这是 PDF Docum
itext - 使用 iText 提取 PDF 文本
我们正在研究信息提取，我们想使用iText。我们正在探索 iText。根据我们查阅过的文献，iText 是最好的工具。是否可以从 iText 中每行的 pdf 中提取文本？我在与我的相关的 stac
itext - 使用 iText 填充现有的 pdf 文本字段
我已经创建了一个带有一些文本字段的 pdf 文档。我可以使用 Adobe 阅读器填充这些文本字段并将这些值保存在该文件中。我的问题是，我可以使用 iText 以编程方式执行此操作吗？如果可能，请
itext - 如何摆脱 PdfPCell、iText 5 中的顶部填充
我正在使用 iText 5 表创建标签(如 Avery 标签)。标签元素的定位需要一些非常严格的公差，以便适合标签上的所有内容。我的问题是标签上有多个区域为 PdfPCells。我需要将文本放入这些区

首页

博学

6Ren·AI

商城

java - 使用 iText 将 HTML 转换为 PDF 时出错