gpt4 book ai didi

html - 使用 YQL 加载多个 url 时取回 url

转载 作者:太空狗 更新时间:2023-10-29 15:08:36 25 4
gpt4 key购买 nike

我正在使用 YQL 获取一堆页面,其中一些可能处于脱机状态(显然我不知道是哪些)。我正在使用这个查询:

SELECT * FROM html WHERE url IN ("http://www.whooma.net", "http://www.dfdsfsdgsfagdffgd.com", "http://www.cnn.com")

第一个和最后一个是实际站点,而第二个显然不存在。实际上返回了两个结果,但加载它们的 url 没有出现在任何地方。那么,如果不是查询中的每个页面都已加载,那么找出哪个 html 页面属于哪个 url 的方法是什么?

最佳答案

不幸的是,我不知道有什么方法可以在响应中获取键=>值对,其中键是 url,值是 html 响应。但是,您可以尝试以下查询,看看它是否符合您的用例:

select * from yql.query.multi where queries="select * from html where url='http://www.whooma.net';select * from feed where url='http://www.dfdsfsdgsfagdffgd.com';select * from html where url='http://www.cnn.com'"

试一试 here .您可以做的是在触发查询之前,在 queries 中维护 url 数组中的顺序,如下所示['http://www.wooma.net','http://www.dfdsfsdgsfagdffgd.com','http://www.cnn.com']。我们可以调用这个数组 A 当你遍历 YQL 查询的响应时,不存在的 url 将返回 null。上述查询的示例响应:

<results>
<results>
// Response from select * from html where url='http://www.whooma.net'. This should be some html
</results>
<results>
// Response from select * from feed where url='http://www.dfdsfsdgsfagdffgd.com'. This should be null.
</results>
<results>
// select * from html where url='http://www.cnn.com'. This should also be some html
</results>
</results>

总而言之,您可以遍历数组 A 和来自 YQL 的响应。数组 A 的第一个元素应该对应于该 YQL 响应的第一个 results(内部结果)元素。即您正在从两个数组创建 HashMap 。我知道答案很长,但我认为这是必要的。如果有任何混淆,请告诉我。

关于html - 使用 YQL 加载多个 url 时取回 url,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19145999/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com