gpt4 book ai didi

metadata - 谷歌从哪里获得其每个站点结果的摘要,并显示在其搜索结果页面上?

转载 作者:行者123 更新时间:2023-12-01 15:16:55 24 4
gpt4 key购买 nike

我正在从事一个项目,在该项目中,我必须在搜索引擎上搜索术语,然后根据上下文对结果进行聚类。所以我必须将每个结果视为一个文档。不幸的是,结果页面上与每个结果一起出现的数据对于聚类来说太少了。因此,我想知道搜索引擎从哪里获取它们显示的每个结果的摘要。如果我可以获得整个摘要,那么我可以通过将它们视为单独的文档来对结果进行聚类。

Google 从哪里获取摘要?例如:如果您在 google 上搜索“1000 Mile”,第二个结果显示以下摘要:“女士 1000 Mile 系列以经典设计为基础,体现了 Wolverine 制作优质鞋履的悠久传统。与这些经典相得益彰……”

此摘要不存在于页面的元标记中

Google 从哪里找到这些数据。

谢谢

最佳答案

来自 Does Google use the Meta Description Tag for Description of Page?

Google 将从以下位置(不一定按此顺序)选择您的搜索结果片段:

  1. 页面的元描述标签
  2. 该页面的开放目录项目 (ODP) 列表
  3. 与搜索查询相关的页面内容

如果您希望 Google 使用 ODP 列表的描述,那么您可以使用以下元标记告诉他们不要这样做:

<meta name="robots" content="NOODP">

如果您想鼓励 Google 使用您的元描述标签,请确保它对每个页面都是唯一的。还要确保它包含对页面内容的准确描述。

在缺少 ODP 描述和元描述标记的情况下,Google 将使用页面文本的一部分作为描述。此文本将包含与搜索查询最接近的匹配项。我还没有看到任何关于这可以持续多长时间的官方限制,但几句话似乎是正确的。

在相关说明中,如果您不希望在特定页面上显示片段,您可以使用以下元标记来阻止片段显示:

<meta name="robots" content="nosnippet">

参见 this blog post获取 Google 关于使用元描述标签的提示。

根据 this site , "元描述的长度通常不应超过 145 到 150 个字符,因为这些是通常分别在 Yahoo! 和 Google 上显示的最大字符数。"

关于metadata - 谷歌从哪里获得其每个站点结果的摘要,并显示在其搜索结果页面上?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7673334/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com