- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个开发网站https://text-domain.com . (不是真正的网站)
当我去https://duckduckgo.com并搜索 text-domain.com,它确实会返回结果。
到目前为止我尝试了什么:
已创建 robots.txt
带有以下代码的文件(放在我的根目录中,即 text-domain.com/robots.txt):
User-agent: *
Disallow: /
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
最佳答案
DuckDuckGo 在包含在他们的结果中是一个奇怪的鸭子。我已经在许多搜索引擎上对这个主题进行了大量研究,并与 DDG 来回发了一些电子邮件。
这是交易。他们从其他搜索引擎获取内容,如 listed here .据我所知,他们的搜索结果并未指明哪个搜索引擎是其来源,因此要删除您的内容,您基本上需要上游到所有来源并从那里删除您的内容。如果这听起来很麻烦,请不要担心 - 无论如何您都想这样做,对吗?
DDG 也有自己的爬虫,恰本地称为 the DuckDuckBot .确实如此 不是 荣誉noindex
HTML 标记,也不是 HTTP header (它确实尊重 robots.txt
),但这似乎无关紧要,因为 DuckDuckBot 没有创建新的结果 .据我所知,这在任何地方都没有记录,但我与他们的工作人员进行了交谈,我在下面引用了这些内容:
DDG 说 (2014-06-06):
We get our results from multiple sources and our own crawler wouldn't be the cause of your [problem]. Our crawler only does very specific tasks, like looking (and not actually crawling) parked domains, spam sites, etc.
If there are results from [your website] appearing on DuckDuckGo and shouldn't be, they're likely flowing from one of our upstream sources. If removed there, then they'll stop showing in our results.
OK, so nothing gets put in your index via your crawlers, which indeed do not support
noindex
HTML or HTTP tags?
Yep! Sorry for the confusion and, if you see anything out of the ordinary, please feel free to let us know.
noindex
HTML 元标记和 x-robots
HTTP 标记(用于图像等)告诉搜索引擎不要在其结果中包含某些内容; robots.txt
屏蔽不支持的搜索引擎noindex
或 x-robots
标签。 sitemaps.xml
文件,所以他们有 noindex
设置(因此不会出现在搜索结果中)。 robots.txt
做同样的事情文件。 关于web-crawler - 从搜索引擎阻止网站 - DuckDuckGo,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18079649/
我想做的只是提交字符串查询(相当于手动在搜索栏中键入内容)并保存第一个结果的URL(如果有)。 我曾问过类似的问题(Python search scraping),它的答案与google配合得很好,我
我注意到在使用 DuckDuckGo 时,当我访问该页面时,链接旁边会出现一个勾号,如下所示: 特别让我感兴趣的是,与浏览器应用 a:visited 伪类的紫色链接不同,这是 DOM 中的一个单独元素
我正在尝试安装 duckduckgo适用于 Python 3.6 (Windows),但不知道如何操作。 我第一次尝试 pip install duckduckgo 引发异常 ModuleNotFou
我正在将我的个人搜索建议从 google 转移到 duckduckgo,但我缺少一些简单的方法来让它发挥作用。我正在使用 jQuery-UI's autocomplete framework . 我的
我有一个开发网站https://text-domain.com . (不是真正的网站) 当我去https://duckduckgo.com并搜索 text-domain.com,它确实会返回结果。 到
使用 DuckDuckGo API 的默认搜索仅返回第一页上的结果(我猜大约有 25 个)。有什么方法可以获取更多结果或导航到搜索结果的第 2、3 页? 像 Faroo 这样的网站有一个名为 s 的参
编辑 我现在意识到 API 根本不够用,甚至无法正常工作。我想重定向我的问题,我希望能够使用他们的“我感觉很鸭”来自动神奇地搜索 duckduckgo。例如,这样我就可以搜索“stackoverflo
我想添加简单的站点搜索,使用 Duckduckgo ,仅限于搜索“example.com”。 Stackoverflow已经解决了这个问题,使用一些 JavaScript 来添加 site:examp
DDG 上“apple”的示例搜索结果:http://duckduckgo.com/apple 如果您向下滚动几次,则会使用 ajax 获取更多结果。然后你点击一个链接,访问结果,点击后退按钮,DDG
有人知道直接通过 Android 上的官方 Duckduckgo 应用程序进行搜索的 Intent 吗? Tried this one so far, i think they dont have a
我使用 BeautifulSoup 库创建了一个 Python 3 脚本。它的作用是使用以下 url 转到 duckduckgo 搜索引擎:https://duckduckgo.com/?q=sear
我正在尝试使用 AJAX收集 DuckDuckGo's Search API 的搜索结果. 这是我迄今为止编写的 JavaScript: $.ajax({ type: 'GET', url:
我正在编写一个脚本,该脚本打开 firefox,其中包含它为给定术语找到的第一个 duckduckgo 结果。 我知道。它非常有用。 但是当从我的浏览器复制一个 url 并用 python 请求它时:
我实现了 this user script (在 MIT/expat 下开源)启用向上/向下箭头迭代(使用键盘箭头键),就像这个页面 - https://duckduckgo.com/?q=javas
我希望我没有遗漏任何地方,但我无法理解我正在做的事情到底发生了什么。 我正在编写一个网络应用程序,在我的应用程序中,我以编程方式打开一个新页面以在 duckduckgo 中搜索内容。我正在使用以下代码
我目前正在使用 DuckDuckGo 图标实用程序来获取某些网页的图标,尽管为了获取图标,它需要您在请求的最后添加“.ico”,例如:https://icons.duckduckgo.com/ip2/
这是我的 Duck Duck Go 搜索脚本。 import duckduckgo r = duckduckgo.query('DuckDuckGo') print r.results[0].url
我正在使用node.js、microsoft bot框架和duckduckgo api,我想根据我得到的asnwer文本和url的问题显示图像结果,但图像没有在我的机器人中显示。谢谢。我提供了下面的代
一个简单的问题。我可以从 duckduckgo 搜索的第一页中抓取结果。然而,我正在努力进入第二页和后续页面。我已将 Python 与 Selenium Webdriver 结合使用,这对于首页结果来
这个项目的目的是强制在主要搜索引擎上进行安全搜索。 我设法安装了 Squid(3.3 版)和 SquidGuard,将 Squid 配置为具有 SSL 拦截功能的透明代理... 我设法在 Google
我是一名优秀的程序员,十分优秀!