java - 在itextpdf中应用位置提取策略后，我们可以使用文本提取策略吗？-6ren

java - 在itextpdf中应用位置提取策略后，我们可以使用文本提取策略吗？

转载作者：行者123 更新时间：2023-12-01 12:47:56

24

4

我使用以下代码从特定位置获取 PDF 中的数据。我想在该位置显示粗体文本。

Rectangle rect = new Rectangle(0,0,250,250);
RenderFilter filter = new RegiontextRenderFilter(rect);
fontBasedTextExtractionStrategy strategy = new fontBasedTextExtractionStrategy();
strategy = new FilteredTextRenderListener(new LocationTextExtractionStrategy(), filter); //Throws Error.

首先，创建一个名为 fontBasedTextExtractionStrategy 的新方法而不是简单的文本 TextExtractionStrategy 有帮助吗？类似下面的内容

 public class fontBasedTextExtractionStrategy implements TextExtractionStrategy {
    private String text;

    @Override
    public void beginTextBlock() {
    }

    @Override
    public void renderText(TextRenderInfo renderInfo) {
        text = renderInfo.getText();

        System.out.println(renderInfo.getFont().getFontType());

        System.out.print(text);
    }

    @Override
    public void endTextBlock() {
    }

    @Override
    public void renderImage(ImageRenderInfo renderInfo) {
    }

    @Override
    public String getResultantText() {
        return text;
    }
}

但是如何正确调用它呢？

最佳答案

请查看 ParseCustom例子。在此示例中，我们创建一个自定义 RenderFilter(不是 TextExtractionStrategy):

class FontRenderFilter extends RenderFilter {
    public boolean allowText(TextRenderInfo renderInfo) {
        String font = renderInfo.getFont().getPostscriptFontName();
        return font.endsWith("Bold") || font.endsWith("Oblique");
    }
}

此文本将过滤所有文本，以便仅过滤 Postscript 字体名称以 Bold 或 Oblique 结尾的文本。

这是使用此过滤器的方式:

public void parse(String filename) throws IOException {
    PdfReader reader = new PdfReader(filename);
    Rectangle rect = new Rectangle(36, 750, 559, 806);
    RenderFilter regionFilter = new RegionTextRenderFilter(rect);
    FontRenderFilter fontFilter = new FontRenderFilter();
    TextExtractionStrategy strategy = new FilteredTextRenderListener(
            new LocationTextExtractionStrategy(), regionFilter, fontFilter);
    System.out.println(PdfTextExtractor.getTextFromPage(reader, 1, strategy));
    reader.close();
}

如您所见，我们创建了一个 FilteredTextRenderListener，它采用两个过滤器:一个 RegionTextRenderFilter 和我们基于字体自制的过滤器。

关于java - 在itextpdf中应用位置提取策略后，我们可以使用文本提取策略吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24506830/

24

4

0

文章推荐： java - 跟踪文档位置变化

文章推荐： Dockerizing Postfix 中继服务器

文章推荐： java - Hibernate 与 postgres 发生异常，无法找到表

文章推荐： PhpStorm 无法解锁文件 (Ionic)

java - iTextPDF 库 JAVA - 无法解析导入 com.itextpdf
我正在用 JAVA 创建一个简单的程序，其中有一个按钮，单击后即可创建 PDF。我正在使用 iText JAVA 库来生成 PDF。我已将 iText .jar 文件包含在“Java 构建路径”中，但
iTextPDF 库 - 找不到类 "com.itextpdf.text.pdf.PdfAWriter"
在最新版本的 itextpad v5.4.0 中找不到类“com.itextpdf.text.pdf.PdfAWriter”。我什至尝试下载额外的 jar，但无济于事。我们将不胜感激。最佳答案我
java - itextPdf 的问题，拒绝重新初始化先前失败的类 java.lang.Class
我是 android 的新手，我正在尝试在 android 中将位图转换为 Pdf。我正在使用 itextpdf 5.5.4 jar 文件。我使用的代码如下: import com.itextpdf.
html - 如何解决ExceptionConverter com.itextpdf.text.html.simpleparser.TableWrapper cannot be cast to com.itextpdf.text.TextElementArray
我使用以下代码的目的是将 HTML 文件转换为 PDF try { com.itextpdf.text.Document document = new com.itextpdf.text
java - ItextPdf 宽度不会针对横向页面扩展
我正在尝试将表格放在已在“PdfPageEventHelper”中横向旋转的 PDF 页面上: public void onStartPage(PdfWriter writer_,Document d
java - iTextPdf 无法正确加载图像
嘿哟，我的这段代码有问题: private void createPDF(String[] url, String name) throws FileNotFoundException, Docu
java - itextpdf 生成损坏的链接
我在使用 itext 7 时遇到两个问题。其中一个是，如果您引入的链接长于一行，则第一行将显示为其自己的链接，只有第二行引用整个内容。第二个问题是关于在链接周围添加边框。该边框仅出现在链接的后半部分(
java - iTextPdf 中的单元格之间是否可以有空格？
iTextPdf 是否允许设置表格中单元格之间的间距？我有一个包含 2 列的表格，我正在尝试在单元格上绘制边框底部。我希望每个边框之间的空间与单元格填充相同。我正在使用下面的代码: Pdf
java - iTextPDF 超链接未链接到正确的位置
我有一堆 PDF，此时我已将它们合并到代码中。在合并的 PDF 的开头，我有一个内容页面，分别链接到所述 PDF。这些 pdfAction.gotoLocalPage 链接有时无法正常工作，而是跳转到
java - iTextpdf 背景仅设置为可用文本
以下是我使用 iText 从 Java 生成 PDF 的代码: import java.io.File; import java.io.FileOutputStream; import java.io
java - 将整个页面提取为图像 iTextPdf
是否可以通过 iTextPDF 库从现有的 pdf 文件中提取页面并将整个页面另存为图像。例如，如果我的 pdf 文件包含 2 个页面，那么将生成 2 个图像，每个图像将是特定页面的快照。最佳答案
java - itextpdf 特定页面上的不同边距
大家好! 我对文档有一些疑问: itextpdf 是否可以选择在特定页面上设置不同的边距？我试过用 document.setMargin 然后 document.newPage 但似乎每一页都有相同的
php - itextpdf 仅从命令行嵌入字体
我在 Ubuntu 上使用 itextpdf 来填写带有数据的 PDF 表单。事实上，我使用了这个工具包中包含的一个类(实用程序):PdfFormFiller。数据由 Unicode 字符串表示。为了
java - iTextPDF:动态更改表格对齐方式
我想动态对齐 iText PdfTable。如何在 iTextPDF 中设置基于 x 和 y 位置的对齐方式。 PdfPCell cell; cell = new PdfPCell(testTabl
java - iTextPdf:动态改变单元格宽度
我正在使用 iTextPdf 为 pdf 构建表格。每页将有 9 到 15 列，确切数字直到运行时才知道。 iTextPDF 非常适合在整个页面宽度上创建大小相同的列。但我想不通的是如何创建不同宽度的
c# - iTextPdf 如何分页
我使用 iTextPdf 从 html 页面生成 pdf 文件，例如: iTextSharp.text.html.simpleparser.HTMLWorker hw = new iTextSharp
com.itextpdf.text.ZapfDingbatsList类的使用及代码示例
本文整理了Java中com.itextpdf.text.ZapfDingbatsList类的一些代码示例，展示了ZapfDingbatsList类的具体用法。这些代码示例主要来源于Github/Sta
java - 我想使用 itextpdf 动态设置表格行的高度
如何在 iTextpdf 中设置表格的行位置和宽度？这里我需要如何设置每个单元格的位置以及如何在 itextpdf 中设置行间距 testTable11_close_right.getDefaultC
itext - itextpdf pdfcontentbyte addtemplate的参数是什么意思
我正在使用 itextpdf 将一些 pdf 合并为一个。 itextpdf pdfcontentbyte addtemplate的参数是什么意思，没有文档描述。最佳答案下面的代码成功了，感谢帮助
java - 如何使用 iTextPDF 创建段落？
我有这个移动应用程序，我需要将数据库的一些行导出为 pdf。我需要有一个 pdf 结构才能正确放置信息。这是我的代码，但由于某种原因 PDF 是空白的。主要目标是在开头有一个标题，然后是数据库中的一行

首页

博学

6Ren·AI

商城

java - 在itextpdf中应用位置提取策略后，我们可以使用文本提取策略吗？