java - 用PDFBox插入NULL字符-6ren

java - 用PDFBox插入NULL字符

转载作者：太空宇宙更新时间：2023-11-04 07:28:21

25

4

让我们考虑以下代码：

public class Test1{

    public static void CreatePdf(String src) throws IOException, COSVisitorException{
    PDRectangle rec= new PDRectangle(400,400);
    PDDocument document= null;
    document = new PDDocument();
    PDPage page = new PDPage(rec);
    document.addPage(page);
    PDDocumentInformation info=document.getDocumentInformation();
 PDStream stream= new PDStream(document);
    info.setAuthor("PdfBox");
    info.setCreator("Pdf");
    info.setSubject("Stéganographie");
    info.setTitle("Stéganographie dans les documents PDF");
    info.setKeywords("Stéganographie, pdf");
    content= new PDPageContentStream(document, page, true, false );
    font= PDType1Font.HELVETICA;

String hex = "4C0061f";  // shows "La"
//Notice that we have 00 between 4C and 61 where 00 =null character


       StringBuilder sb = new StringBuilder();
        for (int count = 0; count < hex.length() - 1; count += 2)
    {
        String output = hex.substring(count, (count + 2));
        int decimal = Integer.parseInt(output, 16);
        StringBuilder ae= sb.append((char)decimal);
    }
        String tt=sb.toString();
    content.beginText();
    content.setFont(font, 12);
    content.appendRawCommands("15 385 Td\n");
   content.appendRawCommands("("+tt+")"+"Tj\n");
    content.endText();
   content.close();
    document.save("doc.pdf");
    document.close();       
    }

我的问题是：为什么在PDF文档中用空格代替“ 00”而不是空字符？
注意，该空字符的宽度为0.0，但在PDF文档中显示为空格！
因此我得到：“ L a”而不是“ La”

最佳答案

为什么将“ 00”替换为PDF文档中的空格而不是空字符？

如果您查看PDF，则会发现用于文本的字体定义为：

9 0 obj
<<
/Type /Font
/Subtype /Type1
/BaseFont /Helvetica
/Encoding /WinAnsiEncoding
>>
endobj

因此，您可以使用带有WinAnsiEncoding的字体。如果查看 PDF specification附件D中该编码的定义，您会发现没有32（十进制）以下的代码映射到任何内容。因此，您想要做的是使用手头编码中未定义的字符。因此，行为没有定义。对于那些未定义的代码点，Acrobat Reader似乎使用正宽度。

如果要确保隐藏的字符根本不会引起任何移位，则应在字体字典中添加一个显式的宽度数组，参见。 PDF specification中的9.6.2节，并确保不可见字符的宽度为0。（顺便说一句，几年前，不建议像PDFBox那样不嵌入widths数组）。

请注意，此空字符的宽度为0.0

一旦您进入未定义的范围，任何事情都可能发生，并且不同的程序具有不同的假设。

PS一些代码...行之间

font= PDType1Font.HELVETICA;

和

String hex = "4C0061f";  // shows "La"

我添加了以下代码：

InputStream afmStream = ResourceLoader.loadResource("org/apache/pdfbox/resources/afm/Helvetica.afm");
AFMParser afmParser = new AFMParser(afmStream);
afmParser.parse();
FontMetric afmMetrics = afmParser.getResult();
List<Float> newWidths = new ArrayList<Float>();
for (CharMetric charMetric : afmMetrics.getCharMetrics())
{
    if (charMetric.getCharacterCode() < 0)
        continue;
    while (charMetric.getCharacterCode() >= newWidths.size())
        newWidths.add(0f);
    newWidths.set(charMetric.getCharacterCode(), charMetric.getWx());
}
font.setFirstChar(0);
font.setLastChar(newWidths.size() - 1);
font.setWidths(newWidths);

此代码应读取PDFBox中包含的Helvetica.afm字体指标资源，并从中创建FirstChar，LastChar和Widths条目。可以在这里正常使用，但是如果您的安装中没有安装，只需从PDFBox罐中提取afm文件，然后使用 FileInputStream.读取

由于某些原因，00字符似乎仍然认为它具有一定的宽度，但是可以使用低于32（十进制）的其他字符，例如

String hex = "4C0461f";

无间隙显示“ La”。如果我正确地解释了您以前关于1C和1D的问题（现在已删除），那么这已经可以帮助您继续。

PPS：关于评论中的问题：

您能告诉我这种方法的所有缺点吗？以及为什么此方法不与重音符匹配，例如（Lé），您的代码仅与不带重音符的字符匹配，但是当我们带有重音符时，我们得到Lé而不是Le ..我只想知道有什么缺点您的代码：）

我无法告诉所有人（因为我对字体问题并不真正了解），但是从本质上讲，上述方法并不完整。

如开头所述，您使用的字体带有WinAnsiEncoding，其中没有32（十进制）以下的代码映射到任何内容。通过添加FirstChar，LastChar和Widths条目，我们尝试为代码低于32的那些字符定义零宽度。

尽管如此，尽管如此，我们既不关心这些代码的编码信息（编码仍然是纯WinAnsiEncoding），也没有考虑字体是否实际上包含那些代码的任何信息。此外，为了使事情仍然难以控制，我们正在谈论Helvetica，即PDF浏览器必须始终携带其自身信息的标准14种字体之一。无论明确给出的信息与查看者带来的信息有何矛盾，PDF查看器都可能倾向于偏向于自己的信息。

为什么特别是带有重音符号的字符有麻烦？我不确定。不过，我想这与以下事实有关：字体通常不会将带重音符号的字符作为单独的实体，而是将带重音字符和无重音字符组合在一起。也许在内部，查看者使用的字体具有一些映射到低于32的代码点的此类组合字符的信息，因此，当您的低于32的显式代码与字体对此类代码的隐式使用并排出现时，显示将变得古怪。

基本上，我通常建议不要这样做。对于普通的PDF文档，根本没有必要。

但是，就您的情况而言，在为文档Stéganographiedans les文档PDF命名时，您显然确实希望以某种方式隐藏PDF中的信息。使用看不见的，无法打印的字符似乎是一种方法。因此，您可以朝那个方向尝试。但是PDF确实提供了许多其他方式，可以将任何数量的信息放入PDF中而不会直接可见。

因此，根据您的特定目标，我认为其他方法可能会更安全地隐藏信息，例如私有PieceInfo部分或其他一些词典中的自定义标签...

关于java - 用PDFBox插入NULL字符，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18184254/

25

4

0

文章推荐： python - Numpy 聚合行和总和

文章推荐： python - 如何在安装了 python 2 和 3 的情况下使用 pip？ (OSX)

文章推荐：代码厨师 : reverse Polish Notation

java - Java 方法如何检索属于该特定方法的方法对象？ ( java )
我正在编写一个具有以下签名的 Java 方法。 void Logger(Method method, Object[] args); 如果一个方法(例如 ABC() )调用此方法 Logger，它应该
java - (Java) Java 找不到我的图像文件
我是 Java 新手。我的问题是我的 Java 程序找不到我试图用作的图像文件一个 JButton。 (目前这段代码什么也没做，因为我只是得到了想要的外观第一的)。这是我的主课代码: packag
java - java Java 有手动垃圾回收吗？
好的，今天我在接受采访，我已经编写 Java 代码多年了。采访中说“Java 垃圾收集是一个棘手的问题，我有几个 friend 一直在努力弄清楚。你在这方面做得怎么样？”。她是想骗我吗？还是我的一生都
java - Java 之谜 - Java
我的 friend 给了我一个谜语让我解开。它是这样的: There are 100 people. Each one of them, in his turn, does the following
java - Java 字节码是否兼容不同版本的 Java？
如果我将使用 Java 5 代码的应用程序编译成字节码，生成的 .class 文件是否能够在 Java 1.4 下运行？如果后者可以工作并且我正在尝试在我的 Java 1.4 应用程序中使用 Jav
java - Java 缺少无符号原始类型是 Java 平台的特征还是 Java 语言的特征？
有关于why Java doesn't support unsigned types的问题以及一些关于处理无符号类型的问题。我做了一些搜索，似乎 Scala 也不支持无符号数据类型。限制是Java和S
java - Java 7 的 Java 字节码可以在其他版本的 Java 中工作吗
我只是想知道在一个 java 版本中生成的字节码是否可以在其他 java 版本上运行最佳答案通常，字节码无需修改即可在较新版本的 Java 上运行。它不会在旧版本上运行，除非您使用特殊参数 (
java -cp 。 test.java 与 java test.java
我有一个关于在命令提示符下执行 java 程序的基本问题。在某些机器上我们需要指定 -cp 。 (类路径)同时执行java程序 (test为java文件名与.class文件存在于同一目录下) jav
java - 使用 Java (Java EE/Java SE) 的数据库应用程序设计模式
我已经阅读 StackOverflow 有一段时间了，现在我才鼓起勇气提出问题。我今年 20 岁，目前在我的家乡(罗马尼亚克卢日-纳波卡)就读 IT 大学。足以介绍:D。基本上，我有一家提供簿记应用
java - Java 中的解析可在 Java 中访问
我有 public JSONObject parseXML(String xml) { JSONObject jsonObject = XML.toJSONObject(xml); r
java - Java 中的解释性语言以及对 Java 方法的调用
我已经在 Java 中实现了带有动态类型的简单解释语言。不幸的是我遇到了以下问题。测试时如下代码: def main() { def ks = Map[[1, 2]].keySet()
java - java 序数 - Java I 类
一直提示输入 1 到 10 的数字 - 结果应将 st、rd、th 和 nd 添加到数字中。编写一个程序，提示用户输入 1 到 10 之间的任意整数，然后以序数形式显示该整数并附加后缀。 public
java - 如何从 Java 执行 Java？
我有这个 DownloadFile.java 并按预期下载该文件: import java.io.*; import java.net.URL; public class DownloadFile {
java - 延迟不适用于 java gui(java)
我想在 GUI 上添加延迟。我放置了 2 个 for 循环，然后重新绘制了一个标签，但这 2 个 for 循环一个接一个地执行，并且标签被重新绘制到最后一个。我能做什么？ for(int i=0;
java - Java 类中的硬编码 Java 列表
我正在对对象 Student 的列表项进行一些测试，但是我更喜欢在 java 类对象中创建硬编码列表，然后从那里提取数据，而不是连接到数据库并在结果集中选择记录。然而，自从我这样做以来已经很长时间了，
java - java 幕后对象创建(java 对象实例化)
我知道对象创建分为三个部分: 声明实例化初始化 classA{} classB extends classA{} classA obj = new classB(1,1); 实例化它必须使用
java - 车辆跟踪系统[java/Java EE]
我有兴趣使用 GPRS 构建车辆跟踪系统。但是，我有一些问题要问以前做过此操作的人: GPRS 是最好的技术吗？人们意识到任何问题吗？我计划使用 Java/Java EE - 有更好的技术吗？如果
java - 逆数组(Java)//逆数组(Java)
我可以通过递归方法反转数组，例如:数组={1,2,3,4,5} 数组结果={5,4,3,2,1}但我的结果是相同的数组，我不知道为什么，请帮助我。 public class Recursion { p
java - Java/Java EE 的构建和集成环境
有这样的标准方式吗？包括 Java源代码-测试代码- Ant 或 Maven联合单元持续集成(可能是巡航控制)ClearCase 版本控制工具部署到应用服务器最后我希望有一个自动构建和集成环境。
java - 我将如何从 java 程序打印文本？ ( java )
我什至不知道这是否可能，我非常怀疑它是否可能，但如果可以，您能告诉我怎么做吗？我只是想知道如何从打印机打印一些文本。有什么想法吗？最佳答案这里有更简单的事情。 import javax.swin

首页

博学

6Ren·AI

商城

java - 用PDFBox插入NULL字符