gpt4 book ai didi

java - web harvest - 抓取一个 url

转载 作者:行者123 更新时间:2023-11-30 09:25:09 26 4
gpt4 key购买 nike

我正在使用网络收获。但是,我想从 URL 中抓取数据:

http://derstandard.at/anzeiger/immoweb/Suchergebnis.aspx?Regionen=9&Bezirke=&Arten=&AngebotTyp=&timestamp=1363305908912

我的代码是:

<?xml version="1.0" encoding="UTF-8"?>

<config>
<var-def name="google">
<html-to-xml>
<http url="http://derstandard.at/anzeiger/immoweb/Suchergebnis.aspx?Regionen=9&Bezirke=&Arten=&AngebotTyp=&timestamp=1363305908912"></http>
</html-to-xml>
</var-def>
</config>

但是我得到:

Reference to the entity Bezirke has to end with an ';'

我不明白带';'的网络收获是什么意思?

最佳答案

我不太了解网络收集,但他们的例子是这样的:

<xpath expression="//a[@shape='rect']/@href">
<html-to-xml>
<http url="http://www.somesite.com/"/>
</html-to-xml>
</xpath>

<http url =".." />

而你的代码有

<http url = ".."></http> 

也许这是你的问题?不需要结束标签

关于java - web harvest - 抓取一个 url,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15422524/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com