- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
当我从我的任何源 PDF 打印 PDF 时,文件大小下降并删除了表单中显示的文本框。简而言之,它将文件展平。这是我想要实现的行为。
以下代码使用另一个 PDF 作为源(我想要展平的那个)创建 PDF,它也写入文本框表单。
我可以得到没有文本框的 PDF 吗?就像我将 PDF 打印为 PDF 时 Adobe 所做的那样。
我的其他代码看起来像这样减去了一些东西:
import os
import StringIO
from pyPdf import PdfFileWriter, PdfFileReader
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import letter
directory = os.path.join(os.getcwd(), "source") # dir we are interested in
fif = [f for f in os.listdir(directory) if f[-3:] == 'pdf'] # get the PDFs
for i in fif:
packet = StringIO.StringIO()
can = canvas.Canvas(packet, pagesize=letter)
can.rotate(-90)
can.save()
packet.seek(0)
new_pdf = PdfFileReader(packet)
fname = os.path.join('source', i)
existing_pdf = PdfFileReader(file(fname, "rb"))
output = PdfFileWriter()
nump = existing_pdf.getNumPages()
page = existing_pdf.getPage(0)
for l in range(nump):
output.addPage(existing_pdf.getPage(l))
page.mergePage(new_pdf.getPage(0))
outputStream = file("out-"+i, "wb")
output.write(outputStream)
outputStream.close()
print fName + " written as", i
总结:我有一个 pdf,我向其中添加了一个文本框,覆盖了信息并添加了新信息,然后我从该 pdf 打印了一个 pdf。文本框不再可编辑或移动。我想自动执行该过程,但我尝试的一切仍然允许该文本框可编辑。
最佳答案
如果安装操作系统包是一个选项,那么您可以使用 pdftk
及其 python 包装器 pypdftk
,如下所示:
import pypdftk
pypdftk.fill_form('filled.pdf', out_file='flattened.pdf', flatten=True)
您还需要安装 pdftk
包,在 Ubuntu 上可以这样做:
sudo apt-get install pdftk
pypdftk
库可以从 PyPI 下载:
pip install pypdftk
更新:pdftk 已在 version 18.04 中从 Ubuntu 中短暂删除, 但它似乎又回来了 since 20.04 .
关于python - 使用 Python 生成扁平化的 PDF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27023043/
我有一个 TeamCity (9.0.2) 构建配置,其中包含以下工件路径模式: App\Agent\**\bin\%env.Configuration%\** => Deployment\Agent
我在 src 目录中有一个具有嵌套文件结构的项目。到目前为止,我一直在使用 babel --out-dir lib src 。最近我想到了一个想法,让用户直接使用单独的文件,所以基本上我想改造这个结构
我有一个数据库表,其中三列对于这个问题至关重要: 组 ID,将行分组在一起 开始日期 结束日期 我想从此表中创建一个 View ,以便将具有相同分组 ID 的重叠日期间隔展平。 不重叠的日期间隔不得展
我有一个很大的 pandas 数据框,有 8 列和几个 NaN 值: 0 1 2 3 4 5 6 7 8 1 Google, Inc. (Date 11/07/20
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 5 年前。 Improve this ques
我想将 simd_float4x4 或 simd_float3x3 矩阵展平为单个浮点元素数组。 对于常规数组我会使用 let arr = [[1,2,3],[4,5,6],[7,8,9]] prin
我正在寻找一种 Pythonic 方式来获取 OrderedDict 的 .values 的并集,在 折叠组成值的列表之后。我希望结果是一维列表,根据自定义顺序排序。 我在做什么: from coll
这个问题在这里已经有了答案: How do I make a flat list out of a list of lists? (36 个答案) 关闭 9 年前。 所以我目前正在使用 mongoe
我有一个像这样的数组。 [{"title"=>"ga:browser=Internet Explorer", "dimensions"=>[{:browser=>"Internet Explorer"
我正在尝试使用 Tabulator 创建工单列表,数据通过 AJAX url 从工单系统导入为 JSON,如下所示。 { "results": [ {
我有两个函数,每个函数都返回 CompletebleFuture实例,我想 or它们变成一个有序且可短路的 future 。 public CompletableFuture doA(); publi
我需要在 mysql 中用逗号分隔值将非主键列展平为一行。让我们举一个简单的例子。有一个名为 stud_sub 的表,其中 stud_id 和 sub_id 作为复合主键。现在我想要一个表,其中 st
这个问题在这里已经有了答案: Comprehension on a nested iterables? (13 个答案) 关闭 4 个月前。 我最近在寻找一种将嵌套的 Python 列表展平的方法,
我在 C# 中有一个 json 对象(表示为 Newtonsoft.Json.Linq.JObject 对象),我需要将它扁平化为字典。让我用一个例子来说明我的意思: { "name": "t
有人可以帮我进行以下转换吗? 这里是输入的xml: My book 200 big Smith Wallace
在下面的代码中,x 是 Future[Future[Int]] 类型,我需要将其展平为 Future[Int] .这怎么可能? def times(a:Int, b:Int) = Future
我对 R 还很陌生,我正在尝试使用 aggregate对数据帧、每个主题和数据集中的每个指标执行一些时间序列整形。这很好用,但我发现结果不是很容易使用的格式。我希望能够将结果转换回与原始数据帧相同的格
我有一个项目,我需要填写预制的 PDF,我想到的最合乎逻辑的解决方案是将预制的 PDF 制作成 PDF 表单,以便输入值应该放在标签中,然后我可以查看 PDF 中的表单标签,并将它们与值字典对齐。 我
首先,我对 Azure 还很陌生。 我已使用 Web 角色成功将 ASP.NET MVC 3 Web 应用程序部署到 Azure。该应用程序使用 Entity Framework 和 SQL Azur
我试图将 XML 层次结构展平为文本节点,其中输出标记名称是每个文本节点路径上的连字符连接标记。我对 http://www.chilkatsoft.com/xml-samples/bookstore.
我是一名优秀的程序员,十分优秀!