python - xPath:将表达式与实际源代码匹配困难-6ren

python - xPath:将表达式与实际源代码匹配困难

转载作者：太空宇宙更新时间：2023-11-03 16:47:14

25

4

从此Deutsche Börse web page ，在表头Issuer下我想获取字符串内容'db X-trackers'在包含名称的单元格旁边。

使用我的 Web 浏览器，检查该表区域并获取代码，并将其粘贴到此 XML 树中，以便我可以测试我的 xPath。

<root>
    <div class="row">
        <div class="col-lg-12">
            <h2>Issuer</h2>
        </div>
    </div>
    <div class="table-responsive">
        <table class="table">
            <tbody>
                <tr>
                    <td>Name</td>
                    <td class="text-right">db X-trackers</td>
                </tr>
            </tbody>
        </table>
    </div>
</root>

根据FreeFormatter.com ，下面的 xPath 成功检索了正确的元素 ( Text='db X-trackers' ):

my_xpath = "//h2['Issuer']/ancestor::div[@class='row']/following-sibling::div//td['Name']/following-sibling::td[1]/text()"

注意:它会转到 <h2>Issuer</h2>首先要确定正确的工作起点。

<小时/>

但是，当我使用 Selenium WebDriver 在实际网页上运行此命令时，None返回。

def get_sibling(driver, my_xpath):
    try:
        find_value = driver.find_element_by_xpath(my_xpath).text
    except NoSuchElementException:
        return None
    else:
        value = re.search(r"(.+)", find_value).group()
        return value

我不认为函数本身有任何问题，因此要么 xPath 有问题，要么实际网页源代码中存在某些内容导致其失效。

在 Chrome 中研究实际的源代码时，它看起来比我在 Inspector 中看到的要困惑一些，这是我用来创建上面的小 XML 树的东西.

<div class="box">
                    <div class="row">
                <div class="col-lg-12">
                        <h2>Issuer</h2>
                </div>
            </div>
    <div class="table-responsive">
            <table class="table">
                    <tbody>
            <tr>
                    <td   >
                        Name
                    </td>
                    <td class="text-right"  >
                        db X-trackers
                    </td>
            </tr>
            <tr>
                    <td   >
                        Product Family
                    </td>
                    <td class="text-right"  >
                        db X-trackers
                    </td>
            </tr>
            <tr>
                    <td   >
                        Homepage
                    </td>
                    <td class="text-right"  >
                        <a target="_blank" href="http://www.etf.db.com">www.etf.db.com</a>
                    </td>
            </tr>
    </tbody>

            </table>
    </div>

上面的源代码是否有一些特殊之处，或者我的 xPath(或函数)是否错误？

最佳答案

我会使用following和 following-sibling轴:

//h2[. = "Issuer"]/following::table//td[. = "Name"]/following-sibling::td

首先我们找到h2元素，然后获取下面的table元素。在 table 元素中，我们查找带有 Name 文本的 td 元素，然后获取以下 td 同级元素。

关于python - xPath:将表达式与实际源代码匹配困难，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36201682/

25

4

0

文章推荐： python - Plotly:始终显示悬停文本

文章推荐：用户定义类中的 C# UpdateListBox 方法声明

文章推荐： python - 如何使用动态对象名称访问Python对象？

文章推荐： c# - 启动 openoffice calc 并打开 csv 文件

在浏览器中显示的Java字符串(源代码)
我正在编写一个 Java 应用程序，该应用程序检查网页的源代码，并在满足源代码中的条件时在我的默认浏览器中向我显示该网页。我通过以下方式获取源代码: String source = getUrlSou
安卓蓝牙-源代码
数周以来，我一直在为 Android 上的蓝牙项目而苦苦挣扎。有谁知道我可以去哪里查看 Google 用于使其蓝牙配对和连接逻辑正常工作的实际代码？我浏览了所有的文档、BluetoothChat 应
Hadoop 源代码
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 4 年前。
特定设备的 Android 源代码
Android 源代码有多个目录，其中包含针对不同设备的代码。此外，在特定目录中，存在显示不同分支和标签的路径。举个例子，在“android/platform/external/iptables”目录
.net - SQLMembershipProvider - 源代码
在哪里可以找到 SQLMembershipProvider (.NET2.0) 的源代码？是可用的么？最佳答案源代码已经发布。 See ScottGu's blog for further de
下载特定的 Android 源代码
我只想知道如何下载特定版本的 Android 源代码。我已经尝试过以下命令 repo init -u https://android.googlesource.com/platform/manifes
frameworks - OpenCL 源代码？
我想看看OpenCL框架是如何实现的。我发现的只是已经编译好的可供下载的库。当然，OpenCL 可以有许多不同的实现，但我想看看其中的一个来了解它是如何完成的。为了确保我自己清楚，OpenCL 框
像专业书籍中一样列出 LaTeX 源代码
latex 源代码列表应该是什么样子才能产生像已知书籍中那样的输出，例如 Spring 框架的输出？我尝试过使用 latex 列表包，但无法生成看起来像下面一样好的东西。因此，我主要对生成类似以下示例
内置函数的 PHP 源代码
PHP 是用 C 语言编写的吗？我在哪里可以在线找到 PHP 源代码而无需下载全部内容？最佳答案 PHP 函数是用 C 编写的 - 您可以在 lxr.php.net 找到可浏览的源代码. 例如:ht
elasticsearch - script_score查询不支持[源代码]
我正在使用Elasticsearch OSS的官方Docker镜像(docker.elastic.co/elasticsearch/elasticsearch-oss:6.2.4)，似乎完全无法使用s
c++ - 在Cython中编译C和C++源代码
我试图在Cython中同时编译C和C++源代码。这是我当前的设置: -setup.py from distutils.core import setup from Cython.Build impor
java - 如何在java中使用selenium获取页面的常规(!)源代码？
好吧，事情是这样的:你们所有人可能都在想同样的事情:您可以使用 driver.getPageSource(); 这部分是正确的。唯一的问题是源代码以一种相当奇怪的方式编译，所有代码都在其中 \&quo
java - TwoLineListItem 源代码
由于 TwoLineListItem 自 API 17 起已被弃用，因此我已采取措施将其替换为自定义 XML 和 ViewHolder。但是，我真的希望我的应用程序看起来与使用 TwoLineList
java - getInputStream() 源代码
要从 HttpURLConnection 获取 InputStream，我们的代码如下 urlConnection.getInputStream(); 如果InputStream是一个Abstract
c++ - 如何编译没有项目文件的C++源代码？
我刚刚开始学习更多关于 C/C++ 的知识，我正在使用 Visual Studio 2013 来管理代码。我正在使用 Tobii EyeX 眼睛注视系统的项目要求我能够稍微调整此代码，但是我不明白如
ios - UIWebView 源代码
我在按钮上有一个IBAction，其中包含以下代码，我尝试使用它来检索 UIWebView 的源代码: - (IBAction)loadInAWebView:(id)sender { [self
调色板生成器的 javascript 源代码
我正在 asp.net 中创建一个网站，我只是想知道有什么方法可以使用 JavaScript 从图像生成调色板吗？类似于 1) http://www.cssdrive.com/imagepalette
c++ - WinKill() 源代码
有人可以分享 WinKill() from AutoIt 的源代码吗？？我想知道它如何处理消息(是/否/取消)以确保它得到正确处理。我想用它来清理桌面上的意外弹出窗口。最佳答案正如我们在下面的
适用于所有平台的 Opencv 源代码
我的问题与 Opencv 的源代码有关。在我看来不同的平台the Opencv website提供不同的代码结构。我只是想知道是否有可能为所有不同的平台提供一个源代码。使用相同的源代码，我可以针对不同
python - 如何将python源代码转换为C++源代码
这个问题在这里已经有了答案: Convert Python program to C/C++ code? [closed] (8 个答案) 关闭 3 年前。我一直在努力寻找一种方法将 .py 源文

首页

博学

6Ren·AI

商城

python - xPath:将表达式与实际源代码匹配困难