gpt4 book ai didi

http - 如何构造复杂的Google Web搜索查询?

转载 作者:可可西里 更新时间:2023-11-01 15:10:27 25 4
gpt4 key购买 nike

使用Google搜索引擎在Web上进行搜索是Internet用户事实上的标准。
Google提供了基本的或advanced form来为其搜索引擎准备查询字符串。假设对不使用Web表单感兴趣,只需使用根据搜索条件构造的查询字符串对特定URL进行HTTP get请求即可。

例如,我可以通过在以下位置执行HTTP请求来搜索单词“hello”的结果:

http://www.google.com/search?q=hello

我可以添加另一个词,例如“世界”,如下:
http://www.google.com/search?q=hello+world

您知道,通过指定类似以下的好参数,可以使搜索更加“复杂”:
  • 或条件
  • 确切的短语
  • 在特定域上搜索
  • 避免使用特定单词
  • 使用特定语言搜索
  • 按地理区域限制搜索
  • 搜索文档类型
  • 等。

  • 如何修改查询字符串以解决上述搜索参数?

    最佳答案

    我仔细检查了Pratik ChowdhuryRobbie Vercammen的答案。它们提供了指向Web文档的链接,这些文档报告了将在Google搜索表单中使用的可能的文本过滤列表。尽管这很有趣,但他们没有提供该问题的答案。因此,我研究了很多问题,并找到了以下解决方案。

    假设您需要对Google搜索进行非本质上的HTTP调用(例如,通过CRON每月运行一次PHP类),以检索特定字符串查询的搜索结果,例如您网站(即mywebsite.com)中所有带有某些单词(即“hello”和“world”)的页面,那么您可以通过HTTP get调用以下地址:

    http://www.google.com/search?q=hello+world+site:mywebsite.com
    q参数可以包含整个搜索查询,但是Google定义了参数的虚拟证明列表。

    注意, AND运算符可以由 as_q参数表示。

    要获取页面结果介于“hello”和“world”(即和OR)之间的结果,必须将查询“q”参数更改为:
    q=hello+OR+world

    而更紧凑的表示形式则使用 as_oq参数:
    as_oq=hello+world

    如果寻找确切的短语“hello world”,则 q参数为:
    q="hello+world"

    同样,另一个紧凑的表示形式使用 as_epq参数:
    as_epq=hello+world

    如果查找所有不包含单词“hello”和“world”的结果,则 q参数为:
    q=-hello+-world

    同样,另一个紧凑的表示形式使用 as_eq参数:
    as_eq=hello+world

    当然, as_qas_oqas_epqas_eq等可以像往常一样(通过使用 &字符)组合到唯一的搜索查询中。因此,例如,我可以搜索单词“hello”和“word”,再搜索“programming”和“code”之间的一个单词,如下所示:
    q=hello+world&as_oq=programming+code

    可以按照以下方式搜索特定的域(再次是mydomain.com):
    as_sitesearch=mydomain.com

    但是,如果您要排除特定的域(例如,因为它是垃圾邮件源),则必须使用标准符号。例如。:
    q=hello+-site:mydomain.com

    返回不在站点mydomain.com中的所有带有单词“hello”的页面。

    要获取特定文件类型,例如pdf,您可以使用 as_filetype:
    as_filetype=pdf

    Google support docs中提供的,可以使用更复杂的搜索参数。
    例如,要获得带有单词同义词的结果,只需在单词前面使用 ~运算符即可,例如
    q=~hello

    此外,如果您想使用通配符,例如要获取所有以“hello”开头并以“world”结尾的确切短语,您应该使用 *运算符:
    q="hello+*+world"

    可能会返回类似“hello to the world”和“hello sweet world”的信息。

    您还可以使用以下关键字来搜索页面标题内或页面URL中的特定单词(有关详细信息,请阅读 here):
  • 标题
  • allintitle
  • inurl
  • allinurl

  • 例如,以下返回所有页面s.a。网址中都包含了“hello”和“world”这两个词:
    q=allinurl:hello+world

    对于Google GUI页面的语言(不是结果之一),必须将语言字符串(例如,英语的 en,法语的 fr,意大利语的 it等)插入查询字符串到 hl参数中。换句话说,如果使用英文版本的Google进行搜索,则查询字符串如下所示:
    http://www.google.com/search?hl=en&q=hello+world+site:mywebsite.com

    要选择特定语言,例如意大利语,请使用 lr查询参数:
    lr=lang_it

    也可以使用 cr参数选择在特定地理区域中发布的页面。例如,查找在意大利发布的所有页面:
    cr=countryIT

    关于http - 如何构造复杂的Google Web搜索查询?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15852238/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com