python - 命名空间错误lxml xpath python-6ren

python - 命名空间错误lxml xpath python

转载作者：太空宇宙更新时间：2023-11-04 07:08:52

27

4

我正在将 word 文档转换为 xml 以使用以下代码比较它们:

word = win32com.client.Dispatch('Word.Application')
wd = word.Documents.Open(inFile)
# Converts the word infile to xml outfile
wd.SaveAs(outFile,11)
wd.Close()
dom=parse(outFile)

我得到的 xml 文件如下所示:

<?xml version="1.0" encoding="utf-8"?>
<?mso-application progid="Word.Document"?>
<w:wordDocument w:embeddedObjPresent="no" w:macrosPresent="no" w:ocxPresent="no" xml:space="preserve" xmlns:aml="http://schemas.microsoft.com/aml/2001/core" xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882" xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:sl="http://schemas.microsoft.com/schemaLibrary/2003/core" xmlns:v="urn:schemas-microsoft-com:vml" xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml" xmlns:w10="urn:schemas-microsoft-com:office:word" xmlns:wne="http://schemas.microsoft.com/office/word/2006/wordml" xmlns:wpc="http://schemas.microsoft.com/office/word/2010/wordprocessingCanvas" xmlns:wsp="http://schemas.microsoft.com/office/word/2003/wordml/sp2" xmlns:wx="http://schemas.microsoft.com/office/word/2003/auxHint">
    <w:ignoreSubtree w:val="http://schemas.microsoft.com/office/word/2003/wordml/sp2"/>
    <w:shapeDefaults>
        <o:shapedefaults spidmax="1027" v:ext="edit"/>
        <o:shapelayout v:ext="edit">
            <o:idmap data="1" v:ext="edit"/>
        </o:shapelayout>
    </w:shapeDefaults>
    <w:body>
        <wx:sect>
            <w:tbl>

            <w:tblGrid>
                <w:gridCol w:w="200"/>
                                       ...
            </w:tblGrid>

                <w:pict>
                        <v:shapetype coordsize="21600,21600" filled="f" id="_x0000_t75" o:preferrelative="t" o:spt="75" path="m@4@5l@4@11@9@11@9@5xe" stroked="f">
                            <v:stroke joinstyle="miter"/>
                            <v:formulas>
                                <v:f eqn="if lineDrawn pixelLineWidth 0"/>
                                ...
                            </v:formulas>
                            <v:path gradientshapeok="t" o:connecttype="rect" o:extrusionok="f"/>
                            <o:lock aspectratio="t" v:ext="edit"/>
                        </v:shapetype>
                        <v:shape id="Picture" o:spid="_x0000_s1026" style="position:absolute;left:0;text-align:left;margin-left:0;margin-top:0;width:400pt;height:40pt;z-index:1;visibility:visible;mso-wrap-style:square;mso-wrap-distance-left:0;mso-wrap-distance-top:0;mso-wrap-distance-right:0;mso-wrap-distance-bottom:0;mso-position-horizontal:left;mso-position-horizontal-relative:text;mso-position-vertical:absolute;mso-position-vertical-relative:line" type="#_x0000_t75">
                            <v:imagedata o:title="" src="wordml://03000001.png"/>
                            <w10:wrap anchory="line"/>
                            <w10:anchorlock/>
                        </v:shape>
                </w:pict> 
                                      ...

我不能使用 xpath 函数(lxml 库)例如，当我尝试时:

import lxml.etree as et
tree = et.parse(xmlFile)
for elt in tree.xpath("//w:gridCol"):
     elt.getparent().remove(elt)

我收到以下错误:

 for elt in tree.xpath("//w:gridCol"):
  File "lxml.etree.pyx", line 2029, in lxml.etree._ElementTree.xpath (src/lxml/lxml.etree.c:45934)
  File "xpath.pxi", line 379, in lxml.etree.XPathDocumentEvaluator.__call__ (src/lxml/lxml.etree.c:114389)
  File "xpath.pxi", line 242, in lxml.etree._XPathEvaluatorBase._handle_result (src/lxml/lxml.etree.c:113063)
  File "xpath.pxi", line 227, in lxml.etree._XPathEvaluatorBase._raise_eval_error (src/lxml/lxml.etree.c:112894)
XPathEvalError: Undefined namespace prefix

我做了一些研究，我猜这是一个命名空间问题，但我不知道如何解决它？

最佳答案

在这段代码中:

for elt in tree.xpath("//w:gridCol"):

w: 不是命名空间；它是一个命名空间 prefix ，它是实际命名空间的有效简写，http://schemas.microsoft.com/office/word/2003/wordml。如果要使用 xpath 方法搜索此命名空间中的元素，则需要为其提供命名空间前缀到命名空间的映射:

tree.xpath("//w:gridCol", namespaces={
  'w': 'http://schemas.microsoft.com/office/word/2003/wordml',
  })

另请注意，不要求您使用相同的命名空间前缀。以下将找到相同的元素:

tree.xpath("//bob:gridCol", namespaces={
  'bob': 'http://schemas.microsoft.com/office/word/2003/wordml'
  })

关于python - 命名空间错误lxml xpath python，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24038744/

27

4

0

文章推荐： c - getopt 没有正确处理错误

文章推荐： css - 由空白引起的 bootstrap bootslider 布局问题

文章推荐： python - 从python中的字符串中提取未知子字符串

PHP 命名空间组织、命名
我面临以下问题: 我有一个命名空间 Exception\* , 其中包含多种类型异常(exception)。我有一个命名空间 Exception\User\* ，其中包含一个特定类型的异常 (
单个气泡的 Highcharts 命名
新的 Highcharts v3.0 气泡图看起来很棒。是否可以用名称/一些文本注释和显示每个气泡？谢谢，奈杰尔。最佳答案您需要做两件事。首先，命名每个数据点(气泡): data: [ {
openssl - EVP_CIPHER* 命名
我通过使用 EVP_get_cipherbyname("AES-256-CTR") 获得了 EVP_CIPHER*，现在我想找到一种方法从 EVP_CIPHER* 返回到原始名称，在本例中为“AES-
javascript - 命名；在javascript中动态创建变量
为了避免 JavaScript 堆问题，我使用多个数组:family1、family2、family3 ...、dogs1、dogs2、dogs3 ... 使用示例:“family1 和 dogs1”
JavaScript 函数..命名？
我很难理解这段代码。这不是我熟悉的典型 Javascript 函数语法。这是一个命名函数吗？或者这是更新事件的回调？抱歉，我对新手问题很陌生，我对 JS 还很陌生。我了解正在发生的一切，除了这个函数语
python - 动态文件创建(命名)
是否可以在 python 中执行以下操作？ i=1 while True: w = open("POSCAR_i","w") i=i+1 if i<10:
函数的 JavaScript 命名
我问这个是因为我刚刚在一段代码上看到它: var myVar = function func(arg){ console.log(arg); } 我不明白为什么函数在为 myVar 定义之前被“
javax.命名.AuthenticationException
我正在尝试为 ActiveDirectory 创建上下文(客户端和服务器都是 Windows)，使用我的 Windows 凭据和 NTLM。这是我的代码: public void func() {
javax.命名.NameNotFoundException
我正在运行一个使用 JBoss5 容器的 ejb 示例。我正在使用一个例子 from here(Part one) . 在示例中，我在 JBoss 中部署了 bean，在 Tomcat 中部署了一个应
c# - 命名 BackgroundWorker
我希望能够命名一个 BackgroundWorker 以便于调试。这可能吗？最佳答案我必须尝试，但你不能只设置 Name BackgroundWorker 执行的 DoWork() 方法中的线程？
Android Activity 命名
我在 Android Activity 和其他类之间遇到了越来越多的命名冲突。我想知道你能不能告诉我你是如何避免这些的。遗憾的是，关于 SO 的相关问题并未涵盖我的特定命名问题。第一个例子我有一个
angular - 命名 socket 中的延迟加载模块抛出错误
当我尝试使用 loadChildren 加载模块以在命名 socket 中加载模块的组件时，出现抛出错误。有没有办法在命名的路由器 socket 中延迟加载模块？ //html //routing
bash - 开始通过 Cron 命名？
很难说出这里问的是什么。这个问题是模棱两可的、模糊的、不完整的、过于宽泛的或修辞的，无法以目前的形式得到合理的回答。如需帮助澄清这个问题以便重新打开它，visit the help center .
idris - 命名 v 未命名数据类型参数
在 Type Driven Development with Idris 第 6 章的代码中，我对这段代码感到困惑: data DataStore : Type -> Type where M
.net - 命名 bool 属性的良好指南
通常，如果有一个属性可以获取/设置状态值，我会使用“Is”，例如: Visibility: .IsVisible 但是对于获取/设置操作的属性，最好使用什么？喜欢: Casting shadows:
oop - 形容词的接口(interface)命名
好的，所以如果你可以很容易地想到一个名词，那么命名一个接口(interface)(或类)很容易:用户、窗口、数据库、流等。形容词或形容词的概念呢？例如有时间戳的东西(HasTimestamp、Tim
powershell - 命名 PowerShell 动词的良好准则是什么？
我刚开始学习 PowerShell，我想知道 Posh 中的 cmdlet(或高级功能，无论它们在 CTP3 中称为什么)是否有一些好的动词指南。如果我做一个get-verb，我可以看到很多。但我仍
jquery - 命名 jQuery 函数
$(".song").live('click', function songClick() { //do stuff }); 你能像上面那样命名一个函数，然后稍后再调用它吗？我尝试过，但没有成
SQL TABLE 命名。人与人
关闭。这个问题是opinion-based .它目前不接受答案。想改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 7年前关闭。 Improve this
spring - 命名 DTO 和实体类
我的 Spring 应用程序中有两组类 - DTO 和实体。在阅读了 Bob 叔叔的 Clean Code 之后，我比以往任何时候都更喜欢正确命名事物。我坐下来重构我的一个 Spring 项目，但

首页

博学

6Ren·AI

商城

python - 命名空间错误lxml xpath python