- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章拿来就用!Python批量合并PDF的示例代码由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
大家好,今天分享一个实用的办公脚本:将多个PDF合并为一个PDF,例如我手上现在有如下3个PDF分册,需要整合成一个完整的PDF 。
如果换成你操作的话,是不是打开百度搜索:PDF合并,然后去第三方网站操作,可能会收费不说还担心文件泄漏,现在有请Python出场,简单快速,光速合并,拿走就用! 。
首先导入需要的库和路径设置 。
1
2
3
4
5
6
7
|
import
os
from
PyPDF2
import
PdfFileReader, PdfFileWriter
if
__name__
=
=
'__main__'
:
# 设置存放多个pdf文件的文件夹
dir_path
=
r
'C:\Scientific Research\Knowladge\Ophthalmology\Chinese Ophthalmology'
# 目标文件的名字
file_name
=
"中华眼科学(第3版)合并版.pdf"
|
接着获取所有pdf文件的绝对路径,这里需要利用os库中的os.walk遍历文件和os.path.join拼接路径 。
1
2
3
4
|
for
dirpath, dirs, files
in
os.walk(dir_path):
print
(dirpath)
print
(files)
# 结果返回当前路径、当前路径下文件夹,并以列表返回所有文件
|
建议直接将需要合并的pdf放在一个文件夹,这样就无需再对文件后缀进行判断,包装成函数后如下:
1
2
3
4
5
|
def
GetFileName(dir_path):
file_list
=
[os.path.join(dirpath, filesname) \
for
dirpath, dirs, files
in
os.walk(dir_path) \
for
filesname
in
files]
return
file_list
|
调用该函数的结果 。
现在建立合并PDF的函数 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
def
MergePDF(dir_path, file_name):
# 实例化写入对象
output
=
PdfFileWriter()
outputPages
=
0
# 调用上一个函数获取全部文件的绝对路径
file_list
=
GetFileName(dir_path)
for
pdf_file
in
file_list:
print
(
"文件:%s"
%
pdf_file.split(
'\\')[-1], end='
')
# 读取PDF文件
input
=
PdfFileReader(
open
(pdf_file,
"rb"
))
# 获得源PDF文件中页面总数
pageCount
=
input
.getNumPages()
outputPages
+
=
pageCount
print
(
"页数:%d"
%
pageCount)
# 分别将page添加到输出output中
for
iPage
in
range
(pageCount):
output.addPage(
input
.getPage(iPage))
print
(
"\n合并后的总页数:%d"
%
outputPages)
# 写入到目标PDF文件
print
(
"PDF文件正在合并,请稍等......"
)
with
open
(os.path.join(dir_path, file_name),
"wb"
) as outputfile:
# 注意这里的写法和正常的上下文文件写入是相反的
output.write(outputfile)
print
(
"PDF文件合并完成"
)
|
可以看到虽然待合并的PDF文件比较大,但是依旧快速的合并成功! 。
最后附上完整代码,只需将代码中PDF的路径和文件名修改即可使用! 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
|
import
os
from
PyPDF2
import
PdfFileReader, PdfFileWriter
def
GetFileName(dir_path):
file_list
=
[os.path.join(dirpath, filesname) \
for
dirpath, dirs, files
in
os.walk(dir_path) \
for
filesname
in
files]
return
file_list
def
MergePDF(dir_path, file_name):
output
=
PdfFileWriter()
outputPages
=
0
file_list
=
GetFileName(dir_path)
for
pdf_file
in
file_list:
print
(
"文件:%s"
%
pdf_file.split(
'\\')[-1], end='
')
# 读取PDF文件
input
=
PdfFileReader(
open
(pdf_file,
"rb"
))
# 获得源PDF文件中页面总数
pageCount
=
input
.getNumPages()
outputPages
+
=
pageCount
print
(
"页数:%d"
%
pageCount)
# 分别将page添加到输出output中
for
iPage
in
range
(pageCount):
output.addPage(
input
.getPage(iPage))
print
(
"\n合并后的总页数:%d"
%
outputPages)
# 写入到目标PDF文件
print
(
"PDF文件正在合并,请稍等......"
)
with
open
(os.path.join(dir_path, file_name),
"wb"
) as outputfile:
# 注意这里的写法和正常的上下文文件写入是相反的
output.write(outputfile)
print
(
"PDF文件合并完成"
)
if
__name__
=
=
'__main__'
:
# 设置存放多个pdf文件的文件夹
dir_path
=
r
'C:\Scientific Research\Knowladge\Ophthalmology\Chinese Ophthalmology'
# 目标文件的名字
file_name
=
"中华眼科学(第3版)合并版.pdf"
MergePDF(dir_path, file_name)
|
以上就是拿来就用!Python批量合并PDF的示例代码的详细内容,更多关于Python合并PDF的资料请关注我其它相关文章! 。
原文链接:https://cloud.tencent.com/developer/article/1627099 。
最后此篇关于拿来就用!Python批量合并PDF的示例代码的文章就讲到这里了,如果你想了解更多关于拿来就用!Python批量合并PDF的示例代码的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
这是我在阅读了几个关于 jpa 批量插入的主题后创建的简单示例,我有 2 个持久对象用户和站点。一个用户可以有多个站点,所以我们在这里有一对多的关系。假设我想创建用户并将多个站点创建/链接到用户帐户。
我有文档列表(对象),该对象有多个文档,即存在 Json 记录,但是当我尝试上传文档束(记录)时,它没有上传到文档数据库,但当我上传单个文档记录时,它上传成功。 List listObj = ne
我希望进行批量域名查找,看看是否有一些域名可供购买。我找不到 perl 模块,但似乎应该有一种方法可以在 perl 中执行此操作。我正在寻找免费的东西。谢谢! 最佳答案 从这里:http://www.
我制作了一个批处理类来检查 FTP 上的文件、下载它们并在 FTP 上删除它们。 当我手动运行它(不是批量运行)时,它运行完美,下载 FTP 中的所有文件并在下载完成后删除它们。 当我尝试批量运行时,
我有一个 *+* 形式的字符串 base。我想得到+之前的所有内容。例如,如果 base=foo+bar,我想获取 foo。 我尝试过使用字符串替换来实现 set left=%base:+*=% 但这
我需要创建几十个表,并且我需要它们是innodb, 有没有办法做到这一点,而不是将 engine=innodb 附加到每个 create table 语句? 最佳答案 可以在服务器级别指定默认引擎,在
我正在尝试制作显示 unix/linux 提示符的 dos shell。代码是: @echo off :hi set tmpdrv=%cd:~0,2% if %homedrive% == %tmpdr
我有以下代码,基本上是在二维矩阵的每一行上进行一维卷积。卷积核是一样的。所以真的是 SIMD 案例。 a = [ 1,2,3,4,5; 6,7,8,9,7; 7,6
情况: 我尝试在 shell 中的循环内移动文件,但我的代码无法正常工作。 for /D %%F in (*) do ( if "%%F" NEQ "%directoryToPutFilesIn
目录包含 2 个(或更多)任意名称的视频文件。 video1.mkv video2.mkv 需要找出每个视频的持续时间。为此,我们使用 MediaInfo . setlocal EnableDelay
如何在 Windows 中批量删除数千个文件中的空格(而不是替换为下划线)?我可以从 DOS 命令执行此操作吗? 目前: file one.mp3 file two.mp3 所有文件需要变成: fil
我想创建一个批处理文件,它读取 2 个不同的值,并根据它们的比较方式进行相应处理。但是,比较永远不会起作用。代码是: REM string1 and string2 contain the follo
我正在尝试将一个文件夹的子文件夹复制到许多其他名称未知的文件夹中。目的是在所有使用它的员工文件夹中备份程序的源文件。如果在员工文件夹中找不到程序文件夹,则不应执行任何操作。这看起来如下: 来源: F:
我正在寻找一种简单的方法来检测一小段文本(几句话)是否为英语。在我看来,这个问题比尝试检测任意语言要容易得多。有没有可以做到这一点的软件?我正在用 python 编写,并且更喜欢 python 库,但
我们正在尝试向 8k 种不同的设备发送促销推送消息。我们正在成功响应推送通知 URL https://fcm.googleapis.com/fcm/send 但只有部分用户收到此通知,并非全部。那么
基本上我只是用这一段来替换我的 var 中的一个字符串,但我无法让嵌套延迟扩展正常工作。这甚至可能吗? set replace=!replace:!search!=!replaceVal!! 我知道执
如何使用 ffmpeg 对一批视频文件进行编码,使用相同的设置? 我找到了 one-line solution将当前文件夹中的 .avi 文件转换为 .mov。请注意,我要编码 .mov -> .mo
我正在尝试制作一个批处理文件,每次循环时都会将变量增加 1,然后检查变量是否等于 5,如果不是,则再次循环。我知道这可能有一个 while 循环,但我不知道如何做到这一点,我现在只是享受学习 Batc
我正在尝试创建一个循环,读取多个 CSV 文件,这些文件都具有相同类型的气温数据。但是,我想跳过数据上方的行。这些是数据集中的“警报”。每个文件可能有不同数量的警报,因此要跳过不同数量的行。见下文:
因此,我正在批量创建一个Mail程序,而消息传递部分出现了问题。 消息传递部分是无限循环。 当我输入多个单词时,它会崩溃。 这是代码。请帮忙! :rep set line= set /p line=
我是一名优秀的程序员,十分优秀!