- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想使用基于XPDF的PDFTOTEXT命令行工具查看PDF文件,希望得到UTF-8输出。我在 StackOverflow 上看到其他人得到了它——问题 4039930、3809761 和 13618330 表明其他人已经能够使用它。
当我使用选项 -enc utf-8
显示这些消息:
Syntax Error: Couldn't find unicodeMap file for the 'utf-8' encoding
Config Error: Couldn't get text encoding
最佳答案
您应该使用 UTF-8
相反 utf-8
.见 pdftotext
帮助信息:
$ pdftotext -listenc
Available encodings are:
UCS-2
ASCII7
Latin1
UTF-8
ZapfDingbats
Symbol
$ pdftotext -eol unix -nopgbrk -layout -enc utf-8 file.pdf
Syntax Error: Couldn't find unicodeMap file for the 'utf-8' encoding
Command Line Error: Couldn't get text encoding
$ pdftotext -eol unix -nopgbrk -layout -enc UTF-8 file.pdf
$ echo $?
0
关于utf-8 - PDFTOTEXT 输出 UTF-8 格式所需的文件在哪里?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20127496/
我使用了一个 linux 函数将 PDF 文件列表转换为文本。 命令: pdftotext -htmlmeta 这适用于我的大部分文件。 但对于其中的一小部分,这会返回一个空白文本文件。 我不成功的完
我的 Azure 函数遇到运行时错误: Result: Failure Exception: Exception: pdftotext is not installed. It is part of
我正在尝试将 pdf 文件转换为文本文件。当我通过终端运行命令时它工作正常但是当尝试通过 PHP 执行它时它不工作。 过去四个小时以来,我一直处于这种情况,我花了很多时间在谷歌上,但没有可用的解决方案
我想解析一个pdf文件,因为我正在使用pdftotext实用程序将pdf文件转换为文本文件,现在我想从文本文件中删除页码、页眉和页脚。 我正在使用以下语法转换 pdf 文件: pdftotext -l
我正在尝试通过 PHP 和 XPDF (pdftotext.exe) 将 pdf 解析为 text。在我的本地主机上,一切正常,但当我尝试移动服务器上的一切时,我遇到了麻烦。 首先我检查了服务器上的一
我正在尝试使用 pdftotext 软件将 pdf 文档转换为文本文档。 我需要从 python 脚本调用此应用程序 inc 命令提示符来转换文件。 我有以下代码: import os import
当我在包含 PDF 文件的目录上运行以下 Python 脚本时,我不断收到此错误: ShellError: The command pdftotext "path/to/pdf/title.pdf"
我正在尝试安装 pdftotext,但即使在安装可视化工具后我仍然收到相同的错误。 pip install 都会发生这种情况,我只是想在我的目录中找到它... 终端输出如下: C:\Users\gar
我正在运行 PdfToText通过 Java 进程: File pdf = new File( "/path/to/test.pdf" ); File output = new File( "/pat
pdftotext 库是 requirements.txt 中的一个要求。在尝试推送到 heroku 时,出现以下错误: remote: Running setup.py insta
我有一个 python 脚本,它一直崩溃: subprocess.call(["pdftotext", pdf_filename]) 错误是: OSError: [Errno 2] No such f
我正在尝试在 Windows 上安装 pdftotext: pip install pdftotext 它最初失败是因为缺少 MS visual studio(现已安装),现在由于 poppler 问
我想使用基于XPDF的PDFTOTEXT命令行工具查看PDF文件,希望得到UTF-8输出。我在 StackOverflow 上看到其他人得到了它——问题 4039930、3809761 和 13618
我正在寻找实现 java 解决方案的最简单方法,该解决方案与 的输出非常安静 pdftotext -layout FILE 在 Linux 机器上。 (当然它也应该便宜) 我刚刚尝试了 IText、P
我正在我的 Ruby 项目中转换 pdf 文件。为此,我正在使用 pdf 工具包 gem。 文档显示了如何使用 pdftotext pdftotext(文件,outfile = nil,&block)
我正在使用一个名为 pdftotext 的简单实用程序从 pdf 文件中提取文本。我发现在使用 -table 选项时它的输出最干净、最清晰,但是 此命令行选项仅适用于该实用程序的 Windows 版本
pdftotext 获取 PDF 文件并将文本转换为 .txt 文件。 我如何让 pdftotext 将结果发送到 PHP 变量而不是文本文件? 我假设我必须运行 exec('pdftotext/pa
是否可以调用 CLI 工具,如 pdftotext、antiword、catdoc(文本提取器脚本)传递字符串而不是文件? 目前,我阅读了使用 child_process.spawn 调用 pdfto
我写了一个小的 python 脚本来解析/提取 PDF 中的信息。我在我的本地机器上测试了它,我有 python 2.6.2 和 pdftotext 版本 0.12.4。 我正在尝试在我的虚拟主机服务
我正在使用 Python 库 pdftotext抓取 PDF 文件的文本。效果很好,但我需要命令行工具随 pdftotext -layout pdf_file.pdf 一起提供的“-layout”选项
我是一名优秀的程序员,十分优秀!