gpt4 book ai didi

html - 我在使用 seo 和 htaccess 时遇到问题,爬虫检查了我的网站两次

转载 作者:行者123 更新时间:2023-12-04 16:32:08 25 4
gpt4 key购买 nike

我正在尝试优化我的 SEO,我正在尝试一些网站,例如 sitechecker dot pro

Both pages listed
我仍然不知道为什么它将我的站点读作两个站点,域和 index.html .
这是我的 .htaccess文件:

RewriteEngine On
RewriteCond %{HTTPS} off
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
RewriteCond %{HTTP_HOST} !^www.example.com$
RewriteRule (.*) https://www.example.com/$1 [L,R=301]

<ifModule mod_gzip.c>
mod_gzip_on Yes
mod_gzip_dechunk Yes
mod_gzip_item_include file .(html?|txt|css|js|php|pl)$
mod_gzip_item_include handler ^cgi-script$
mod_gzip_item_include mime ^text/.*
mod_gzip_item_include mime ^application/x-javascript.*
mod_gzip_item_exclude mime ^image/.*
mod_gzip_item_exclude rspheader ^Content-Encoding:.*gzip.*
</ifModule>
我也有 SSL,但我仍然不知道是什么问题。
顺便说一下,我的规范网址是:
 <!-- Canonical URL -->
<link rel="canonical" href="/index.html" />
希望我能得到一些帮助,提前致谢。

最佳答案

<!-- Canonical URL -->
<link rel="canonical" href="/index.html" />

也许你刚刚更新了这个,但这不是你的页面所说的:
<!-- Canonical URL -->
<link rel="canonical" href="https://www.example.com/" />

...这确实是首选 URL(即没有 index.html )。它也是您在页面上主要链接到的 URL。
但是,您仍然链接到 index.html从你的标志。这需要更正为简单的 href="/" .
您需要确保在整个站点中只链接到这些 URL 之一。
更正所有内部链接后,您可以在 .htaccess 中实现重定向。为搜索引擎和任何可能关注书签或第 3 方链接的用户更正此问题。
例如,删除 index.html从 URL 中,您可以在 .htaccess 的顶部添加以下内容文件(紧跟在 RewriteEngine On 指令之后):
RewriteCond %{ENV:REDIRECT_STATUS} ^$
RewriteRule ^index\.html$ / [R=301,L]
但这必须在所有内部链接都已更正后才能实现。
首先使用 302(临时)重定向进行测试以避免缓存问题。
前面的 RewriteCond指令是为了确保我们不会得到重定向循环(因为 mod_dir 为 index.html 发出内部子请求)。

关于html - 我在使用 seo 和 htaccess 时遇到问题,爬虫检查了我的网站两次,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63313809/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com