asp.net-mvc - 保护网站内容免受爬虫的侵害-6ren

asp.net-mvc - 保护网站内容免受爬虫的侵害

转载作者：行者123 更新时间：2023-12-04 21:50:00

34

4

商业网站 (ASP.NET MVC) 的内容会定期被竞赛爬取。这些人是程序员，他们使用复杂的方法来抓取网站，因此无法通过 IP 识别他们。
不幸的是，用图像替换值不是一种选择，因为屏幕阅读器 (JAWS) 仍应保持该站点可读。

我个人的想法是使用robots.txt:禁止爬虫访问页面上的一个常用URL(这可以伪装成普通的元素详情链接，但对普通用户隐藏有效的URL:http://example.com?itemId=1234禁止:http://example.com?itemId=123低于128) .如果 IP 所有者输入了禁止链接，则显示 CAPTCHA 验证。
普通用户永远不会关注这样的链接，因为它不可见，Google 不必抓取它，因为它是伪造的。这个问题是屏幕阅读器仍然阅读链接，我认为这不会如此有效，值得实现。

最佳答案

您的想法可能适用于一些基本的爬虫，但很容易解决。他们只需要使用代理并从新 IP 获取每个链接。

如果您允许匿名访问您的网站，那么您将永远无法完全保护您的数据。即使您设法通过大量时间和精力来阻止爬虫，他们也可以让人类使用 fiddler 之类的东西浏览和捕获内容。防止竞争对手看到您的数据的最佳方法是不要将其放在您网站的公共(public)部分。

强制用户登录可能会有所帮助，至少你可以找出谁在爬你的网站并禁止他们。

关于asp.net-mvc - 保护网站内容免受爬虫的侵害，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6596373/

34

4

0

文章推荐： macos - 导入 matplotlib.pyplot 不起作用

文章推荐： api - Facebook fql 不区分大小写的 strpos 版本

文章推荐： XMPP - 从聊天室检索最后 n 条消息

ios - 如何在递归算法中保护 IOS 免受 EXC_BAD_ACCESS
我正在尝试进行一些高度递归的模拟和数学运算，在某些边缘情况下，我会溢出调用堆栈并获得 EXC_BAD_ACCESS 信号。将算法更改为迭代形式是不可行的，因为它是很多遗留代码。并且递归深度限制没有用，
python - 保护 Nose 免受 Python 解释器崩溃
我们有一堆调用 Python C/C++ 绑定(bind)的测试。我们用 Nose 运行这些测试: nosetests myapp ..... ----------------------------
javascript - cookie 是否可以保护 token 免受 XSS 攻击？
关闭。这个问题需要更多focused .它目前不接受答案。想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post . 5年前关闭。 Improve this questi
php - 通过数据包嗅探保护经过身份验证的 PHP session 免受 session 劫持
我对不使用 SSL 保护 PHP session 的主题很感兴趣。令我惊讶的是，如果中间人嗅探用户和服务器之间交换的数据包，即使已通过身份验证，也很容易窃取 session 。我知道有一些策略可以限
php - 通过数据包嗅探保护经过身份验证的 PHP session 免受 session 劫持
我对不使用 SSL 保护 PHP session 的主题很感兴趣。令我惊讶的是，如果中间人嗅探用户和服务器之间交换的数据包，即使已通过身份验证，也很容易窃取 session 。我知道有一些策略可以限
c# - 保护 API 免受 SQL 注入(inject)
我正在创建一个 API，下面的方法通过查询参数中的员工姓名或所有员工获取员工。但是，[FromQuery(Name = "name")] 是否可以防止 SQL 注入(inject)，不确定这是否是 .
java - 保护 Spring MVC 免受 XSS 攻击
我想保护我的应用免受 XSS 攻击。我可以使用任何开箱即用的功能吗？一个外部库来保护整个应用程序的请求？还是 Tomcat 过滤器/阀？谢谢! 最佳答案您可以使用的选项: > Java Encod
php - 保护 PHP session 免受 XSS 攻击
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
c# - 保护 .NET DLL 免受 CLI 修改
这个问题在这里已经有了答案: How to prevent spoofing of DLLs in .NET (2 个答案) 关闭 7 年前。我想保护我的 DLL 不被修补程序修改。听说对DLL进
azure - 保护 Azure WebApp 免受 BEAST 攻击
我刚刚在我的 Azure Web 应用程序上安装了 SSL 证书。我已使用可用的 Symantec SSL 检查器工具检查安装是否正确 here . 在结果中我可以读到 BEAST This serv
javascript - 您如何保护浏览器使用的 RESTful API 免受 CSRF 攻击？
我正在为一组网站设计 API。这些站点非常相似(有点像 StackOverflow、SuperUser 和 ServerFault)，它们有一个共享的后端是有意义的。因此，我们决定尝试使用一个很好的
database - 保护平面文件(sqlite 数据库)免受 HTTP 访问的最受支持的方法？
我正在开发一个使用 SQLite 作为数据库管理系统的 PHP 应用程序，MySQL 和 PostgreSQL 等不是替代方案(尽管我真的很想使用 pgsql)，因为我希望设置对初学者非常友好并且为零
tomcat - 保护 tomcat 6 apr SSL 免受 BEAST 攻击
我们使用 native Apache Portable Runtime SSL 连接器在 Tomcat 6 上运行 Web 应用程序以提供 SSL 连接。我们如何配置服务器以防止 BEAST 攻击？。
jquery - 如何让 $.text() 换行，或者如何使 $.append() 免受 HTML 影响？
我有一个聊天窗口(使用 )有时需要获取多行条目。到现在为止，我只是简单地替换了传入的 \n与并显示带有 .append() 的文本.不幸的是，我发现留下一个裸体 .append()基于用户输入允许
java - 如何保护 javax.xml.transform.TransformerFactory 免受 XML 外部攻击
我已经研究过这个主题，但找不到任何相关信息我们是否需要采取任何安全措施来保护 javax.xml.transform.Transformer 免受 XML 外部实体攻击？我做了以下，它似乎扩展了
node.js - 如何保护开放的 REST API 免受 Node.js 中的滥用？
例如，我有一个用 Node.js 编写的 REST api 端点。非技术用户可以从网页访问，也可以使用 curl 命令通过命令行访问。它不需要任何凭据即可访问它，因为它旨在对任何人开放以供访问。我要解
security - 保护 Amazon Web Services (AWS) S3 免受 DDoS 攻击
我托管了我的博客 Amazon Web Services S3(托管静态文件)。我是否应该添加任何策略或措施来进一步保护我的帐户免受 DDoS/高带宽消耗？最佳答案我认为这是一场音乐会。不是在技术
php - php 站点是否仅使用 mysql SELECT 免受 sql 注入(inject)攻击
我有一个网站使用数据库为网站用户存储信息。所有 mysql 数据库调用都是 SELECT。我使用 $_GET 将变量从一个页面传递到另一个页面，然后在 mysql SELECT 调用中使用这些变量。我
ruby - 卸载 rdoc 可以使 Ubuntu 免受 Ruby RDoc XSS 漏洞的影响吗？
我刚读过 http://www.ruby-lang.org/en/news/2013/02/06/rdoc-xss-cve-2013-0256/ ，关于 RDoc 中 XSS 攻击的报告。我使用的是
c++ - 如何让我的类(class)免受 C++ 中的 "auto value = copy of proxy"地雷的影响？
我正在处理一个相当复杂的数学库，当客户端代码使用 auto 时，我发现了一个令人讨厌的错误。在创建一个最小的复制案例来询问有关它的问题的过程中，我意识到我可以单独使用标准库来复制类似的东西。看这个简单

首页

博学

6Ren·AI

商城

asp.net-mvc - 保护网站内容免受爬虫的侵害