- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试从 HTML 文档生成 PDF 文件。
HTML 文件格式正确且没有错误。我使用 HtmlCleaner 来清理代码,因此它适合使用 iText 创建 PDF 文件。
这是我在 HTML 示例中使用的代码。
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.StringReader;
import java.io.UnsupportedEncodingException;
import com.itextpdf.text.DocumentException;
import com.itextpdf.text.PageSize;
import com.itextpdf.text.html.simpleparser.HTMLWorker;
import com.itextpdf.text.pdf.PdfWriter;
public class pdfIng {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
try {
com.itextpdf.text.Document document = new com.itextpdf.text.Document(PageSize.A4);
PdfWriter pdfWriter = PdfWriter.getInstance(document, new FileOutputStream("D://testpdf.pdf"));
document.open();
document.addAuthor("Author of the Doc");
document.addCreator("Creator of the Doc");
document.addSubject("Subject of the Doc");
document.addCreationDate();
document.addTitle("This is the title");
//SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
//SAXmyHtmlHandler shh = new SAXmyHtmlHandler(document);
HTMLWorker htmlWorker = new HTMLWorker(document);
String str = "<?xml version=\"1.0\" encoding=\"utf-8\"?>"+ " <html> <head /> <body> " +
"<h2>Text</h2> " +
" Here, you will learn how to retrieve all rows from a " +
"database table. You know that table contains the data in " +
"rows and columns format. If you want to access the data from" +
" a table then you need to use some APIs and methods. See brief " +
"descriptions for retrieving all rows from a database table as below: " +
" Description of program: Program establishes the connection " +
"between MySQL database and java file so that the we can retrieve " +
"all data from a specific database table. If any exception occurs " +
"then shows a message SQL code does not execute. " +
"<br /> <br /> <hr /> <br /> " +
"<b>Name</b> " +
"AAAAAA AAAAAAAAA <br /> <b>Date :" +
"</b> 17/04/2011 00:31:18 <br /> <b>Text:" +
"</b> <br /> gggggggggggggg <br /> <br /> " +
" <br /> " +
"<br /> <b>Name</b> " +
" BBBBBB BBBBBBBBB <br /> <b>Date " +
":</b> 17/04/2011 00:35:37 <br /> <b>Text:</b>" +
" <br /> gftgfgfgfgfgggfgf gggggg" +
" <br /> <br /> " +
" <br /> <br /> <b>Name</b> " +
"DDDDDD DDDDDDDDD <br /> <b>Date :</b> " +
" 16/04/2011 22:28:28 <br /> <b>Text:</b> " +
"<br /> w tawa! <br /> <br /> " +
" <br /> <br /> <b>Name</b> " +
"CCCCCC CCCCCCCCC <br /> <b>Date :</b> " +
"16/04/2011 22:37:08 <br /> <b>Text:</b> " +
"<br /> ched tawa!!! <br /> <br /> " +
" <br /> " +
" <br /> <b>Name</b> " +
"BBBBBB BBBBBBBBB <br /> <b>Date :</b> " +
" 16/04/2011 22:37:26 <br /> <b>Text:</b> " +
"<br /> okiiiiii! <br /> <br /> " +
" " +
" <br /> <br /> <b>Name</b> " +
" AAAAAA AAAAAAAAA <br /> <b>Date :</b> " +
" 17/04/2011 02:41:14 <br /> <b>Text:</b> " +
" <br /> cava hakka?? " +
" <br /> <br /> " +
" <br /> </body></html> ";
System.out.println(str);
htmlWorker.parse(new StringReader(str));
document.close();
} catch(DocumentException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
和输出
Exception in thread "main" java.lang.NullPointerException
at com.itextpdf.text.html.simpleparser.HTMLWorker.createLineSeparator(HTMLWorker.java:435)
at com.itextpdf.text.html.simpleparser.HTMLTagProcessors$5.startElement(HTMLTagProcessors.java:208)
at com.itextpdf.text.html.simpleparser.HTMLWorker.startElement(HTMLWorker.java:189)
at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.processTag(SimpleXMLParser.java:566)
at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.go(SimpleXMLParser.java:340)
at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.parse(SimpleXMLParser.java:592)
at com.itextpdf.text.html.simpleparser.HTMLWorker.parse(HTMLWorker.java:143)
at pdfIng.main(pdfIng.java:78)
我一开始以为这行"<?xml version=\"1.0\" encoding=\"utf-8\"?>"
导致错误,但事实并非如此。
我在 str 字符串中搜索了是否有导致错误的字符,但在我看来所有单词都是正常且健康的,我无法消除任何一个。
预先感谢您的帮助! :)
最佳答案
我发现错误了!这是HR标签!!在 iText 网站上我发现了这个:
删除旧的类/功能;这可能会导致您的应用程序崩溃,但您不应该使用任何这些过时的类,因此这些问题很可能不会出现问题。如果您确实遇到问题,请按照以下说明操作:
the <hr> tag doesn't work anymore in the XML parser
.所以我必须找到其他东西来代替 HR 标签!
关于java - 使用 iText 将 HTML 转换为 PDF 时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5703578/
iText 文档指出它只包含特定的字体子集,但从未说明它们是什么。有没有人知道 iText 中默认包含哪些字体? (我在网上搜索过,在任何地方都找不到这个字体列表!) 最佳答案 它可能指的是PDF S
我使用固定列宽创建了下表,如下所示, Table headerTable = new Table(new float[]{5,5,5}); headerTable.setWidthPercent(
我正在尝试使用 iText 缩放图像(在新的 PDF 文档上)以使其填充页面宽度而不拉伸(stretch),这样它可能需要几页。 我找到了很多解决方案,但它们都非常复杂,而且我真的不喜欢那样编码。到目
我正在使用 Flying Saucer/iText 生成报告。现在报告有一个条件,如果特定条件发生,报告应该移动到 pdf 的下一页,并在 PDF 上添加数据等等。 问候帕万 最佳答案 您必须使用 c
我正在使用 Flying Saucer/iText 生成报告。现在报告有一个条件,如果特定条件发生,报告应该移动到 pdf 的下一页,并在 PDF 上添加数据等等。 问候帕万 最佳答案 您必须使用 c
如何使用 iText 找到文档中的行的位置? 假设我有一个 PDF 文档中的表格,并且想要阅读其中的内容;我想找到细胞的确切位置。为了做到这一点,我想我可能会找到线条的交点。 最佳答案 我认为您使用
请找到下面的代码。 public class MakingFieldReadOnly implements PdfPCellEvent { /** The resulting PDF. */
在 iText 5 中有一个名为 getVerticalPosition() 的方法,它给出了下一个写入对象在页面上的位置。作为回答这个问题 How to find out the current c
抱歉,如果有类似我的帖子,但我是这个论坛的新手,我还没有找到它。 我有动态调整 TextField 大小取决于文本大小的问题。我填写现有的 PDF - 在 AcroForm 中填写字段: form.s
我正在使用 itext 生成 pdf。因此,当页面内容超出时,它会自动创建一个新页面。我想知道它是否创建了一个新页面。如果是,我想在页面顶部添加一些图像。 List paylist =new List
我的 有问题固定 表格左侧和右侧的边距。 我想删除该边距并使用没有边距或填充的所有工作表。我该怎么办? 我刚刚试过这个,但对我不起作用: cell.setPaddingLeft(0); cell.se
我有 2 行,我想对齐(证明)它们。 我有这个代码: Paragraph p=new Paragraph(ANC,fontFootData); p.setLeading(1, 1);
我有这样的场景。 我有一个生成 PDF 的应用程序,需要对其进行签名。 我们没有用于签署文档的证书,因为它们位于 HSM 中,而我们使用证书的唯一方法是使用 Web 服务。 此网络服务提供两个选项,发
我需要实现一个看起来像图片中的表格,列之间有空间。我试过: cell.setPaddingLeft(10); cell.setMarginLeft(10); extractio
我需要实现一个看起来像图片中的表格,列之间有空间。我试过: cell.setPaddingLeft(10); cell.setMarginLeft(10); extractio
我需要使用 Java 的 iText 库创建一个 PDF 文档。我还需要包括一些复选框,这些复选框根据某些类变量的值打开/关闭。我找到了一些关于交互式表单的示例,但我不需要这种复杂程度:只需将一些复选
我正在开发一个系统,我必须在其中将一些图像添加到现有的 PDF 文档中。 这适用于 iText 5.1.3,但由于某种原因,在包含扫描图像的 PDF 中,它不会添加任何图像。 这是 PDF Docum
我们正在研究信息提取,我们想使用iText。 我们正在探索 iText。根据我们查阅过的文献,iText 是最好的工具。是否可以从 iText 中每行的 pdf 中提取文本?我在与我的相关的 stac
我已经创建了一个带有一些文本字段的 pdf 文档。我可以使用 Adobe 阅读器填充这些文本字段并将这些值保存在该文件中。 我的问题是,我可以使用 iText 以编程方式执行此操作吗?如果可能,请
我正在使用 iText 5 表创建标签(如 Avery 标签)。标签元素的定位需要一些非常严格的公差,以便适合标签上的所有内容。我的问题是标签上有多个区域为 PdfPCells。我需要将文本放入这些区
我是一名优秀的程序员,十分优秀!