python doc 到 docx 转换，comtypes.Documents.Open 抛出 ValueError : NULL COM pointer access-6ren

python doc 到 docx 转换，comtypes.Documents.Open 抛出 ValueError : NULL COM pointer access

转载作者：可可西里更新时间：2023-11-01 09:58:59

25

4

背景

我有一个应用程序，我想在其中将 .doc 转换为 .docx。之后处理 .docx 文件以进行数据挖掘。最终用户使用 Web 界面访问此服务。 Web 应用程序是在 Django 1.6 中开发的。

要将 .doc 转换为 .docx，我们需要安装了 MS Office 的 Windows 平台。话虽如此，我有一个正在运行的 AWS Windows Server 2012 R2 实例(它是 Windows 64 位)。我将 Apache(64 位)与 mod_wsgi 和 Python 2.7.8(64 位)一起使用。

现在，这是我将 .doc 转换为 .docx 的代码

import tempfile, sys
import comtypes, comtypes.client

def convert(source):
    tmpfile = tempfile.NamedTemporaryFile(delete=False)
    tmpname = tmpfile.name + ".docx"
    tmpfile.close()
    os.unlink(tmpfile.name)

    try:
        comtypes.CoInitialize();
        wordapp = comtypes.client.CreateObject('Word.Application')
        doc = wordapp.Documents.Open(source, ReadOnly=True)
        doc.SaveAs(tmpname, FileFormat=16)
        doc.Close()
        wordapp.Quit()
    except:
        print sys.exc_info()

    if os.path.exists(tmpname):
        return tmpname
    else:
        return None

我得到的错误是

(<type 'exceptions.ValueError'>, ValueError('NULL COM pointer access',), <traceback object at 0x00000085CE65AC08>)

在线

doc = wordapp.Documents.Open(source, ReadOnly=True)

但有趣的是，这个错误只在我使用网络界面时发生。也就是说，如果我通过 Apache 并调用此代码。

我尝试过直接从命令行作为脚本运行这段代码，它工作得很好。

当转换作为 Django View 的一部分发生时，我收到此错误。

提前致谢。

问候，

普拉塔姆什

最佳答案

如果您仍然遇到这个问题，这就是帮助我实现完全相同的 AWS(Win2012)-Apache(64bit)-Django 布局的原因:

更改 DCOM 配置设置:

开始 -> dcomcnfg.exe
计算机 -> 我的电脑
DCOM 配置
选择 Microsoft Word 97-2003 文档 -> 属性
Tab Identity，从Launching User更改为Interactive User

关于python doc 到 docx 转换，comtypes.Documents.Open 抛出 ValueError : NULL COM pointer access，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26991609/

25

4

0

文章推荐： mongodb 找一个很严格的文件

文章推荐： node.js - 将 Mongoose 数组元素与数组进行比较

Python多处理池 'raise ValueError("池未运行“)ValueError : Pool not running' function with return value
我正在尝试并行运行具有循环返回值的函数。但它似乎停留在 results = pool.map(algorithm_file.foo, population) 在 for 循环的第二次迭代中 r
python - 引发 ValueError ("cannot have a multithreaded and multi process server.") ValueError : cannot have a multithreaded and multi process server
Serving Flask 应用程序“服务器”(延迟加载) 环境:生产警告:这是一个开发服务器。不要在生产部署中使用它。请改用生产 WSGI 服务器。 Debug模式:开启在 http://0.0.
python - 引发 ValueError ("Expected singleton: %s"% self) ValueError : Expected singleton: product. Pricelist()
我使用“product.pricelist”模型中的 get_product_price_rule() 函数。我的代码是: price = self._get_display_price(produ
Python valueError 使用 hstack() (ValueError : all the input array dimensions except for the concatenation axis must match exactly)
我收到以下错误: Traceback (most recent call last): File "/home/odroid/trackAndFollow/getPositions.py", line
machine-learning - 提高 ValueError ("Unknown label type: %s"% repr(ys)) ValueError : Unknown label type: (array
我正在尝试采用机器学习方法，但遇到了一些问题。这是我的代码: import sys import scipy import numpy import matplotlib import pandas
tensorflow 错误 "raise ValueError("形状 %s 和 %s 不兼容"% (self, other)) ValueError : Shapes (? , 5) and (5,) are not compatible"
我尝试使用 tensorflow 1.4.0 对我的原始记录进行分类。过程如下。拳头:读取图片和标签，输出“tfrecord”格式的文件。第二:读取tf记录和训练编写tfrecord脚本是 !/u
python - 引发 ValueError ("bad input shape {0}".format(shape)) ValueError : bad input shape (10, 90)
我是新手，所以需要任何帮助，当我要求一个例子时，我的教授给我了这段代码，我希望有一个工作模型...... from numpy import loadtxt import numpy as np fr
python - 无法使用 json、requests、BeautifulSoup : ValueError(errmsg ("Extra data", s、end、len(s)) 找出 ValueError
我无法弄清楚为什么会出现此 ValueError...为了提供一些上下文，我正在使用 requests、BeautifulSoup 和 json 与 python 来抓取站点 json 数据。我不确
Python List -- ValueError: invalid literal for int() with base 10: ' ' [duplicate](Python List--ValueError：基数为10的int()的文本无效：‘’[Duplate])
我已经尝试使用这两个循环以及列表理解。即使我正在尝试将数字转换为列表中的整型，两者都无法解析整数。
Python List -- ValueError: invalid literal for int() with base 10: ' ' [duplicate](Python List--ValueError：基数为10的int()的文本无效：‘’[Duplate])
我已经尝试使用这两个循环以及列表理解。即使我正在尝试将数字转换为列表中的整型，两者都无法解析整数。
python-3.x - Python 图像保存错误 - 从 e ValueError : unknown file extension: 引发 ValueError ("unknown file extension: {}".format(ext))
我只有四个星期的 Python 经验。使用 Tkinter 创建一个工具，将新的公司 Logo 粘贴到现有图像之上。下面的方法是获取给定目录中的所有图像并将新 Logo 粘贴到初始级别。现有图像、编
python-3.x - Python 图像保存错误 - 从 e ValueError : unknown file extension: 引发 ValueError ("unknown file extension: {}".format(ext))
我只有四个星期的 Python 经验。使用 Tkinter 创建一个工具，将新的公司 Logo 粘贴到现有图像之上。下面的方法是获取给定目录中的所有图像并将新 Logo 粘贴到初始级别。现有图像、编
python-3.x - Keras ValueError : ValueError: Error when checking target: expected dense_4 to have shape (None, 2) 但得到了形状为 (2592, 1) Python3 的数组
我在尝试在 Keras 2.0.8、Python 3.6.1 和 Tensorflow 后端中训练模型时遇到问题。错误消息: ValueError: Error when checking targ
Python List -- ValueError: invalid literal for int() with base 10: ' ' [duplicate](Python List -- ValueError：invalid literal for int（）with base 10：' ' [duplicate])
我已经尝试使用这两个循环以及列表理解。即使我正在尝试将数字转换为列表中的整型，两者都无法解析整数。
Python ValueError 是否可以在不进行字符串解析的情况下获得不正确的值？
我有这段代码: while True: try: start = int(input("Starting number: ")) fin = int(i
python - 初学者得到 ValueError
我是 python 的初学者编码员，试图制作一个“模具滚筒”，您可以在其中选择模具的大小，它在我的代码的第 20 行返回此错误 import sys import random import geto
python - 时间序列数据中的 ValueError
我有以下代码: import fxcmpy import pandas as pd from pandas import datetime from pandas import DataFrame a
python - ValueError at/(未设置所需的参数名称)
我正在尝试使用 django 和 python 制作一个博客应用程序。我也在尝试使用 s3 存储桶进行存储，使用 heroku 进行部署。我正在学习 coreymschafer 的在线教程。我正在按照
python - 更改订单后如何解决numpy ValueError？
我创建了一个 numpy 数组(考虑输入数据)并想更改顺序(一些数值运算后的输出数据)。在使用转换后的数组时，我遇到错误并找到了根本原因。请在下面找到详细信息并使用 numpy 版本 1.19.1 i
Python:ValueError:所有参数都应该具有相同的长度
我已经引用了之前的查询 All arguments should have the same length plotly但仍然没有得到我的问题的答案。我有一个黄金价格数据集。 Date

首页

博学

6Ren·AI

商城

python doc 到 docx 转换，comtypes.Documents.Open 抛出 ValueError : NULL COM pointer access

背景