python批量实现Word文件转换为PDF文件-6ren

python批量实现Word文件转换为PDF文件

转载作者：qq735679552 更新时间：2022-09-28 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章python批量实现Word文件转换为PDF文件由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

本文为大家分享了python批量转换Word文件为PDF文件的具体方法，供大家参考，具体内容如下。

1、目的。

通过万能的Python把一个目录下的所有Word文件转换为PDF文件.

python批量实现Word文件转换为PDF文件

2、遍历目录。

作者总结了三种遍历目录的方法，分别如下.

2.1.调用glob 。

遍历指定目录下的所有文件和文件夹，不递归遍历，需要手动完成递归遍历功能.

 
    ? 
   
         import 
         glob as gb 
        
         path  
         = 
         gb.glob( 
         'd:\\2\\*' 
         ) 
        
         for 
         path  
         in 
         path: 
        
         print 
         path

2.2.调用os.walk 。

遍历指定目录下的所有文件和文件夹，递归遍历，功能强大，推荐使用.

 
    ? 
   
         import 
         os 
        
         for 
         dirpath, dirnames, filenames  
         in 
         os.walk( 
         'd:\\2\\' 
         ): 
        
         for 
         file 
         in 
         filenames: 
        
         fullpath  
         = 
         os.path.join(dirpath,  
         file 
         ) 
        
         print 
         fullpath,  
         file

2.3.自己DIY 。

遍历指定目录下的所有文件和文件夹，递归遍历，自主编写，扩展性强，可以学习练手.

 
    ? 
   
         import 
         os;  
        
         files  
         = 
         list 
         ();  
        
         def 
         DirAll(pathName):  
        
         if 
         os.path.exists(pathName):  
        
         fileList  
         = 
         os.listdir(pathName);  
        
         for 
         f  
         in 
         fileList:  
        
         if 
         f 
         = 
         = 
         "$RECYCLE.BIN" 
         or 
         f 
         = 
         = 
         "System Volume Information" 
         :  
        
         continue 
         ;  
        
         f 
         = 
         os.path.join(pathName,f);  
        
         if 
         os.path.isdir(f):   
        
         DirAll(f);      
        
         else 
         :  
        
         dirName 
         = 
         os.path.dirname(f);  
        
         baseName 
         = 
         os.path.basename(f);  
        
         if 
         dirName.endswith(os.sep):  
        
         files.append(dirName 
         + 
         baseName);  
        
         else 
         :  
        
         files.append(dirName 
         + 
         os.sep 
         + 
         baseName);  
        
         DirAll( 
         "D:\\2\\" 
         );  
        
         for 
         f  
         in 
         files:  
        
         print 
         f 
        
         # print f.decode('gbk').encode('utf-8');

2.4.备注。

注意，如果遍历过程中，出现文件名称或文件路径乱码问题，可以查看本文的参考资料来解决.

3、转换Word文件为PDF 。

通过Windows Com组件（win32com），调用Word服务（Word.Application），实现Word到PDF文件的转换。因此，要求该Python程序需要在有Word服务（可能至少要求2007版本）的Windows机器上运行.

 
    ? 
   
         #coding:utf8 
        
         import 
         os, sys 
        
         reload 
         (sys) 
        
         sys.setdefaultencoding( 
         'utf8' 
         ) 
        
         from 
         win32com.client  
         import 
         Dispatch, constants, gencache 
        
         input 
         = 
         'D:\\2\\test\\11.docx' 
        
         output  
         = 
         'D:\\2\\test\\22.pdf' 
        
         print 
         'input file' 
         ,  
         input 
        
         print 
         'output file' 
         , output 
        
         # enable python COM support for Word 2007 
        
         # this is generated by: makepy.py -i "Microsoft Word 12.0 Object Library" 
        
         gencache.EnsureModule( 
         '{00020905-0000-0000-C000-000000000046}' 
         ,  
         0 
         ,  
         8 
         ,  
         4 
         ) 
        
         # 开始转换 
        
         w  
         = 
         Dispatch( 
         "Word.Application" 
         ) 
        
         try 
         : 
        
         doc  
         = 
         w.Documents. 
         Open 
         ( 
         input 
         , ReadOnly 
         = 
         1 
         ) 
        
         doc.ExportAsFixedFormat(output, constants.wdExportFormatPDF, \ 
        
         Item 
         = 
         constants.wdExportDocumentWithMarkup, 
        
         CreateBookmarks 
         = 
         constants.wdExportCreateHeadingBookmarks) 
        
         except 
         : 
        
         print 
         ' exception' 
        
         finally 
         : 
        
         w.Quit(constants.wdDoNotSaveChanges) 
        
         if 
         os.path.isfile(output): 
        
         print 
         'translate success' 
        
         else 
         : 
        
         print 
         'translate fail'

4、批量转换。

要实现批量准换，将第2步和第3步的功能组合在一起即可，直接上代码.

 
    ? 
   
         # -*- coding:utf-8 -*- 
        
         # doc2pdf.py: python script to convert doc to pdf with bookmarks! 
        
         # Requires Office 2007 SP2 
        
         # Requires python for win32 extension 
        
         import 
         glob as gb 
        
         import 
         sys 
        
         reload 
         (sys) 
        
         sys.setdefaultencoding( 
         'utf8' 
         ) 
        
         ''' 
        
         参考:http://blog.csdn.net/rumswell/article/details/7434302 
        
         ''' 
        
         import 
         sys, os 
        
         from 
         win32com.client  
         import 
         Dispatch, constants, gencache 
        
         # from config import REPORT_DOC_PATH,REPORT_PDF_PATH 
        
         REPORT_DOC_PATH  
         = 
         'D:/2/doc/' 
        
         REPORT_PDF_PATH  
         = 
         'D:/2/doc/' 
        
         # Word转换为PDF 
        
         def 
         word2pdf(filename): 
        
         input 
         = 
         filename  
         + 
         '.docx' 
        
         output  
         = 
         filename  
         + 
         '.pdf' 
        
         pdf_name  
         = 
         output 
        
         # 判断文件是否存在 
        
         os.chdir(REPORT_DOC_PATH) 
        
         if 
         not 
         os.path.isfile( 
         input 
         ): 
        
         print 
         u 
         '%s not exist' 
         % 
         input 
        
         return 
         False 
        
         # 文档路径需要为绝对路径，因为Word启动后当前路径不是调用脚本时的当前路径。 
        
         if 
         ( 
         not 
         os.path.isabs( 
         input 
         )):  
         # 判断是否为绝对路径 
        
         # os.chdir(REPORT_DOC_PATH) 
        
         input 
         = 
         os.path.abspath( 
         input 
         )  
         # 返回绝对路径 
        
         else 
         : 
        
         print 
         u 
         '%s not absolute path' 
         % 
         input 
        
         return 
         False 
        
         if 
         ( 
         not 
         os.path.isabs(output)): 
        
         os.chdir(REPORT_PDF_PATH) 
        
         output  
         = 
         os.path.abspath(output) 
        
         else 
         : 
        
         print 
         u 
         '%s not absolute path' 
         % 
         output 
        
         return 
         False 
        
         try 
         : 
        
         print 
         input 
         , output 
        
         # enable python COM support for Word 2007 
        
         # this is generated by: makepy.py -i "Microsoft Word 12.0 Object Library" 
        
         gencache.EnsureModule( 
         '{00020905-0000-0000-C000-000000000046}' 
         ,  
         0 
         ,  
         8 
         ,  
         4 
         ) 
        
         # 开始转换 
        
         w  
         = 
         Dispatch( 
         "Word.Application" 
         ) 
        
         try 
         : 
        
         doc  
         = 
         w.Documents. 
         Open 
         ( 
         input 
         , ReadOnly 
         = 
         1 
         ) 
        
         doc.ExportAsFixedFormat(output, constants.wdExportFormatPDF, \ 
        
         Item 
         = 
         constants.wdExportDocumentWithMarkup, 
        
         CreateBookmarks 
         = 
         constants.wdExportCreateHeadingBookmarks) 
        
         except 
         : 
        
         print 
         ' exception' 
        
         finally 
         : 
        
         w.Quit(constants.wdDoNotSaveChanges) 
        
         if 
         os.path.isfile(pdf_name): 
        
         print 
         'translate success' 
        
         return 
         True 
        
         else 
         : 
        
         print 
         'translate fail' 
        
         return 
         False 
        
         except 
         : 
        
         print 
         ' exception' 
        
         return 
         - 
         1 
        
         if 
         __name__  
         = 
         = 
         '__main__' 
         : 
        
         # img_path = gb.glob(REPORT_DOC_PATH + "*") 
        
         # for path in img_path: 
        
         #  print path 
        
         #  rc = word2pdf(path) 
        
         # rc = word2pdf('1') 
        
         # print rc, 
        
         # if rc: 
        
         #  sys.exit(rc) 
        
         # sys.exit(0) 
        
         import 
         os 
        
         for 
         dirpath, dirnames, filenames  
         in 
         os.walk(REPORT_DOC_PATH): 
        
         for 
         file 
         in 
         filenames: 
        
         fullpath  
         = 
         os.path.join(dirpath,  
         file 
         ) 
        
         print 
         fullpath,  
         file 
        
         rc  
         = 
         word2pdf( 
         file 
         .rstrip( 
         '.docx' 
         ))

5、参考资料。

利用Python将word 2007的文档转为pdf文件。

遍历某目录下的所有文件夹与文件的路径、输出中文乱码问题。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我.

原文链接：http://blog.csdn.net/san1156/article/details/77885995 。

最后此篇关于python批量实现Word文件转换为PDF文件的文章就讲到这里了,如果你想了解更多关于python批量实现Word文件转换为PDF文件的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐： 8月你好图片说说心情2020最新版八月请对我好一点

文章推荐： python实现求解列表中元素的排列和组合问题

文章推荐：再见七月你好八月心情感悟说说大全关于再见七月的心情说说精选2020

c++ - 将迭代器存储到字符串中(转换、转换、追加？)
我正在尝试将一个字符串逐个字符地复制到另一个字符串中。目的不是复制整个字符串，而是复制其中的一部分(我稍后会为此做一些条件......) 但我不知道如何使用迭代器。你能帮帮我吗？ std::stri
C++:转换/转换 void 指针到结构引用
我想将 void 指针转换为结构引用。结构的最小示例: #include "Interface.h" class Foo { public: Foo() : mAddress((uint
javascript - 为什么一个元素从窗口的左上角开始它的 css3 转换/转换？
这有点烦人:我有一个 div，它从窗口的左上角开始过渡，即使它位于文档的其他任何位置。我试过 usign -webkit-transform-origin 但没有成功，也许我用错了。有人可以帮助我吗？
html - 有什么方法可以检测 CSS3 转换/转换/动画的过程状态？
假设，如果将 CSS3 转换/转换/动画分配给 DOM 元素，我是否可以检测到该过程的状态？我想这样做的原因是因为我正在寻找类似过渡链的东西，例如，在前一个过渡之后运行一个过渡。最佳答案我在 h
CSS 转换/转换 - 谷歌浏览器中的 "shaky"图像
最近我遇到了“不稳定”屏幕，这很可能是由 CSS 转换引起的。事实上，它只发生在 Chrome 浏览器上(可能还有 Safari，因为一些人也报告了它)。知道如何让它看起来光滑吗？此外，您可能会注意
jquery - CSS3 转换(转换)在 Firefox 中不起作用，但在 Chrome 和 Safari 中起作用
我正在开发一个简单的 slider ，它使用 CSS 过渡来为幻灯片设置动画。我用一些基本样式和一些 javascript 创建了一支笔 here .注意:由于 Codepen 使用 Prefixfr
Linq 转换
我正在使用以下代码返回 IList: public IList FindCodesByCountry(string country) { var query =
转换、计算的RESTful设计
如何设计像这样的操作: 计算转化翻译例如:从“EUR”转换为“CNY”金额“100”。这是 /convert?from=EUR&to=CNY&amount=100 RESTful 吗？最佳答
Jquery 转换
我使用 jquery 组合了一个图像滚动器，如下所示 function rotateImages(whichHolder, start) { var images = $('#' +which
CSS 转换
如何使用 CSS (-moz-transform) 更改一个如下所示的 div: 最佳答案你可以看看Mozilla Developer Center .甚至还有例子。但是，在我看来，您的具体示例不
CSS 转换
我需要帮助我正在尝试在选中和未选中的汉堡菜单上实现动画。我能够为菜单设置动画，但我不知道如何在转换为 0 时为左菜单动画设置动画 &__menu { transform: translateX(
swift :转换
我正在为字典格式之间的转换而苦苦挣扎:我正在尝试将下面的项目数组转换为下面的结果数组。本质上是通过在项目第一个元素中查找重复项，然后仅在第一个参数不同时才将文件添加到结果集中。 var items:[
具有相同布局的不同类型之间的C++转换
如果我有两个定义相同的结构，那么在它们之间进行转换的最佳方式是什么？ struct A { int i; float f; }; struct B { int i; float f; }; void
Javascript 转换
我编写了一个 javascript 代码，可以将视口(viewport)从一个链接滑动到另一个链接。基本上一切正常，你怎么能在那里看到http://jsfiddle.net/DruwJ/8/ 我现在的
meteorjs 图像上传/转换
我需要将文件上传到 meteor ，对其进行一些图像处理(必要时进行图像转换，从图像生成缩略图)，然后将其存储在外部图像存储服务器(s3)中。这应该尽可能快。您对 nodejs 图像处理库有什么建议
KDB+，转换，左操作数
刚开始接触KDB+，有一些问题很难从Q for Mortals中得到。说，这里 http://code.kx.com/wiki/JB:QforMortals2/casting_and_enumera
JSF float 转换
我在这里的一个项目中使用 JSF 1.2 和 IceFaces 1.8。我有一个页面，它基本上是一大堆浮点数字段的大编辑网格。这是通过 inputText 实现的页面上的字段指向具有原始值的值对象
SceneKit 转换 ScnMatrix4
ScnMatrix4 是一个 4x4 矩阵。我的问题是什么矩阵行对应于位置(ScnVector3)，旋转(ScnVector4)，比例(ScnVector3)。第 4 行是空的吗？编辑: 我玩弄了
Scala map 转换
恐怕我是 Scala 新手: 我正在尝试根据一些简单的逻辑将 Map 转换为新 Map: val postVals = Map("test" -> "testing1", "test2" -> "te
基于配置文件的 XSLT 转换
输入: This is sample 1 This is sample 2 输出: ~COLOR~[Green]This is sample 1~COLOR~[Red]This is sam

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python批量实现Word文件转换为PDF文件