- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
所以我使用 AJAX
调用服务器文件,该文件使用 WordPress 填充 pages
内容并返回。我用它来填充字段。现在我感到困惑的是,我如何创建快照以及我必须做什么才能让谷歌知道我正在创建除了 #!
还有我为什么要这样做? escaped_fragments
有点不清楚,希望我能得到更详细的解释。有没有人有任何教程可以引导您完成与我正在做的类似的这个过程?
大卫
最佳答案
Google 的抓取工具通常不会运行您的 JavaScript。他们访问了您的页面,抓取了您的 HTML,然后继续前进。这比加载页面及其所有资源、运行 JavaScript、猜测所有内容何时加载完毕,然后从 DOM 中抓取数据要高效得多。
如果您的网站使用 AJAX 来填充页面内容,这对 Google 和其他公司来说是个问题。您的页面实际上是空的...没有任何内容...在其 HTML 状态下。它需要您的 JavaScript 来填充它。由于爬虫不运行您的 JavaScript,因此您的页面对爬虫来说并不是那么有用。
如今,有很多网站混合了基于网络的应用程序和内容驱动的网站之间的界限。这些站点(如您的站点)需要运行客户端代码才能获取内容。 Google 没有资源在他们遇到的每个站点上执行此操作,但他们确实提供了一个选项。那是 info you found about escaped anchor fragments .
Google 为您提供了为他们抓取完整 DOM 的机会。他们将运行 JavaScript 的 CPU 和内存负担重新加给了你。您可以通过使用带 #!
的链接向 Google 表示鼓励这样做。 Google 看到了这一点,知道他们可以请求相同的页面,但将 #!
之后的所有内容(未发送到服务器)转换为 ?_escaped_fragment_=
并制作对您的服务器的请求。此时,在 JavaScript 运行后,您的服务器应该生成完整 DOM 的快照。
好消息是,如今您不必破解大量代码即可完成此操作。我已经使用 PhantomJS 编写了一个服务器来执行此操作。 (我正在尝试获得打开源代码的许可,但它处于法律边缘,抱歉!)基本上,PhantomJS 是一个完整的 webkit 网络浏览器,但它运行时没有 GUI。你可以use PhantomJS to load your site ,运行所有 JavaScript,然后在它准备就绪时从页面中抓取 HTML 并将那个版本发送给 Google。这不需要你做任何特殊的事情,除了修复你的路由以在你的快照服务器上使用 _escaped_fragment_
指向请求。
您可以在大约 20 行代码中完成此操作。 PhantomJS 甚至内置了一个迷你网络服务器,但他们建议不要将其用于生产代码。
我希望这有助于消除一些困惑!
关于php - 为 Google 检索快照 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25538007/
Maven – 快照 大型软件应用程序通常由多个模块组成,这是多个团队工作于同一应用程序的不同模块的常见场景。例如一个团队工作负责应用程序的前端应用用户接口工程(app-ui.jar:1.0)),同
我的 ES 快照不起作用或看起来是空的。 首先,我在我的 Ubuntu 服务器上做了这个: 1.创建备份目录 mkdir /home/admin/dumps/elasticsearch 2. 将此目录
您好,我想将折线图保存为预定义尺寸 (x, y) 的图像。有没有简单的方法来做到这一点?我找不到任何合适的 Snapshot 参数。 WritableImage image = lineCha
我将 Genymotion 与 Oracle VirtualBox 一起使用,但是我有 250 GB 的 SSD,并且我遇到了(快照)问题 我在这里搜索并搜索,我找不到任何可能的方法来禁用自动快照,因
我们想使用 Grafana 来显示测量数据。现在,我们的测量设置创建了大量数据并保存在文件中。我们按原样保留文件,并直接使用 Spark(“数据湖”方法)对其进行后处理。 我们现在想要创建一些可视化,
我不知道如何制作节点组的快照。也就是说,我想制作一个覆盖有数字的 PNG 图标图像(例如未读消息)。 我的代码: int totalNumberOfUnreadMessages = 1; ImageV
我们想使用 Grafana 来显示测量数据。现在,我们的测量设置创建了大量数据并保存在文件中。我们按原样保留文件,并直接使用 Spark(“数据湖”方法)对其进行后处理。 我们现在想要创建一些可视化,
这个问题在这里已经有了答案: How do I return the response from an asynchronous call? (41 个回答) 关闭 4 年前。 function i
我试图在运行我的程序时保存所有内容。我想保存每个游戏对象及其脚本和变量。我知道可以序列化所有内容并将其保存为 XML(以及其他方式/格式,如 JSON)。这将需要大量的工作和时间。该程序将来可能会发生
我正在玩 Screeps ( http://screeps.com/ ) 模拟房间模式。我已经测试了一些东西,我不想失去我的进步。 我可以在模拟房间模式下拍摄快照并保存我的房间状态,这样我就不必从头开
我的应用程序的测试人员报告:“最近的应用程序列表中的应用程序缩略图根本没有调整。在我看来,它要么像主屏幕壁纸(tolikdru:可能,只是透明的矩形),要么像应用程序屏幕的绿色背景,但从来没有真正的应
这个问题在这里已经有了答案: JavaFX I want to save Chart-Image completely (1 个回答) 关闭 3 年前。 我正在尝试获取“Java 弹出窗口”的快照。
我正在使用 pymongo 从 MongoDB 中插入和检索数据。这两个操作可以同时执行。问题是我什么时候做 rows = db..find()在pymongo中,每次rows.count()返回不同
如何获取通过 选择的视频文件的快照在视频中的特定时间在后台静默(即没有可见元素、闪烁、声音等)? 最佳答案 主要有四个步骤: 创建 和 元素。 加载src URL.createObjectURL 生
您好,我正在使用 JavaFx WebView 创建 HTML 页面的屏幕截图,它工作正常,但我想知道是否可以在不在图形窗口中启动应用程序的情况下执行此操作!!我的意思是没有比这更轻量级的方法来获取屏
所以我有一个 horizontalscrollview,我想尝试添加一个对齐效果,它基本上使元素居中。到目前为止,我基本上都是用 XML 完成的。 然后我在里面有一个 LinearLayout。
调用 URL http:///gitweb.cgi?p=;a=tree;f=;hb=HEAD将显示 的树从 开始. 调用 URL http:///gitweb.cgi?p=;a=snapshot;
我们知道,Maven 项目第一次构建时,会自动从远程仓库搜索依赖项,并将其下载到本地仓库中。当项目再进行构建时,会直接从本地仓库搜索依赖项并引用,而不会再次向远程仓库获取。这样的设计能够避免项目每次构
这个问题在这里已经有了答案: Freeze screen in chrome debugger / DevTools panel for popover inspection? (9 个回答) 关闭
我正在开发一个向 DVR 和 IP 摄像机请求快照的应用程序。我正在开发的设备只提供 RTSP 请求。然后我实现了必要的 RTSP 方法来开始接收流数据包,然后通过建立的 UDP 连接开始接收。我的疑
我是一名优秀的程序员,十分优秀!