gpt4 book ai didi

html - 无法获得正确的 xpath 查询以从网页中检索图像

转载 作者:行者123 更新时间:2023-11-28 00:27:09 25 4
gpt4 key购买 nike

我正在使用 C# 创建一个 rss 服务,我们从中检索 rss 新闻的网站之一没有直接链接到它的图像,但是如果我们去他们的直接链接页面,我们可以在帮助下找到图片firebug 并在 firebug 中使用“XPATH”功能我可以获得该特定图片的 XPATH 查询,但似乎 xpathquery 无效,因为我已经检查了它的 xpathquery:HtmlAgilityPack 和 yahoo YQL

这是我从 firebug 中检索到的 xpath:

//body
/form
/table[2]
/tbody
/tr[2]
/td
/table
/tbody
/tr
/td
/table
/tbody
/tr
/td
/img

这是我的 YQL

select * 
from html
where url="http://isna.ir/ISNA/PicView.aspx?Pic=Pic-1718372-1&Lang=P"
and xpath='//body
/form
/table[2]
/tbody
/tr[2]
/td
/table
/tbody
/tr
/td
/table
/tbody
/tr
/td
/img'

这是我要从中检索图像的网站:

http://isna.ir/ISNA/PicView.aspx?Pic=Pic-1718372-1&Lang=P

由于我的 Xpath 能力太弱,我知道的很少,所以我不得不依赖 firebug 等工具......实际上我只知道从选定的 html 标记返回 xpath 的 firebug

所以我在这里有两个问题:

1-你能给我写正确的 xpath 或建议我如何写一个正确的 xpath 吗?

2-有没有其他工具比如firebug可以显示html标签对应的xpath?

问候。

最佳答案

我得到了答案:HtmlAgilityPack 不支持 xpathQuery 中的 [tbody] 和 [html] 标记,所以我重写了我的查询:

//*[@id='Table2']/tbody/tr/td/table/tr/td/img

//body/form/table[2]/tr[2]/td/table/tr/td/table/tr/td/img

这是我通过跟踪 HtmlAgilityPack 得到的结果

/html[1]/body[1]/table[2]/tr[2]/td[1]/table[1]/tr[1]/td[1]/table[1]/tr[1]/td[1]/img[1]

因为上述所有代码对于 HtmlAgilityPack 都是正确的

仅供引用,还有另一个名为 firepath 的 firebug 插件,它将为您提供简洁的查询。

问候。

关于html - 无法获得正确的 xpath 查询以从网页中检索图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5051442/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com