screen-scraping - 防止屏幕抓取-6ren

screen-scraping - 防止屏幕抓取

转载作者：行者123 更新时间：2023-12-03 08:59:11

24

4

关闭。这个问题是off-topic .它目前不接受答案。

想改进这个问题？ Update the question所以它是on-topic对于堆栈溢出。

9年前关闭。

Improve this question

继我关于 Legalities of screen scraping 的问题之后，即使是非法的人们仍然会尝试，所以:

可以采用哪些技术机制来防止或至少抑制屏幕抓取？

哦，只是为了笑容和让生活变得困难，保留搜索引擎的访问权限可能会很好。我很可能在这里扮演魔鬼的拥护者，但有一个严重的潜在问题。

最佳答案

因此，一种方法是混淆代码(rot13 或其他东西)，然后在页面中添加一些 javascript 来执行类似 document.write(unobfuscate(obfuscated_page)) 的操作。但这完全摧毁了搜索引擎(可能!)。

当然，这实际上也不能阻止想要窃取您数据的人，但它确实使事情变得更加困难。

一旦客户端获得了数据，游戏就结束了，所以你需要在服务器端查看一些东西。

鉴于搜索引擎基本上是屏幕抓取工具，事情很困难。你需要看看好的屏幕刮板和坏的屏幕刮板有什么区别。当然，您也只有普通的人类用户。因此，这归结为一个问题，即您如何在服务器上有效地将请求分类为来自人、好的屏幕抓取工具或坏的屏幕抓取工具。

所以，开始的地方是查看你的日志文件，看看是否有一些模式可以让你有效地对请求进行分类，然后在确定模式后，看看是否有某种方式导致屏幕刮板坏了。分类，可以伪装成人类或良好的屏幕刮板。

一些想法:

您也许可以通过 IP 地址确定好的屏幕抓取工具。

您可以通过并发连接数、每个时间段的连接总数、访问模式等来确定爬虫与人工。

显然，这些并不理想或万无一失。另一种策略是确定你可以采取哪些对人类不显眼的措施，但(可能)对爬虫来说很烦人。一个例子可能是减慢请求的数量。 (取决于请求的时间紧迫性。如果他们实时抓取，这将影响他们的最终用户)。

另一方面是着眼于更好地为这些用户服务。显然，他们正在抓取，因为他们想要数据。如果您为他们提供一种直接获取有用格式数据的简单方法，那么他们将更容易做到这一点，而不是屏幕抓取。如果有一种简单的方法，那么可以规范对数据的访问。例如:给请求者一个唯一的key，然后限制每个key的请求数以避免服务器过载，或者每1000个请求收费等。

当然，仍然有人会想要敲诈你，然后可能还有其他方法可以抑制，但他们可能开始变得非技术性，并且需要说服法律途径。

关于screen-scraping - 防止屏幕抓取，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/396817/

24

4

0

文章推荐： ruby-on-rails - 用Rails设计4

文章推荐： symfony - 登录后从登录页面重定向FOSUserBundle

文章推荐： .htaccess - 如何从 URL 中删除 index.php？

文章推荐： perl - “select((select(s),$|=1)[0])”在Perl中做什么？

gnu-screen - 如何创建执行给定命令的 screen ？
我在 * nix 中相当新。有没有办法创建一个屏幕，它会立即执行给定的命令序列(带有自己的参数)？两个小时的谷歌搜索一无所获——也许是因为我不能清楚地陈述问题。我希望像 screen -dmS n
css - 为什么@screen xl 和@screen lg 在tailwindcss 中被@screen md 覆盖？
我顺风顺风margin配置文件中的属性: module.exports = { theme: { extend: { 'margin': {
gnu-screen - GNU screen : output that causes the screen to scroll leaves garbage at the bottom of the window
我正在 cygwin 环境中配置 GNU 屏幕。实际上重新配置——它之前总是有效，当我升级到 cygwin-64 时，相同的配置文件给了我意想不到的行为。发生的情况是，每当我在终端中执行溢出全屏的操
gnu-screen - 使用现有的运行程序启动 gnu screen
关闭。这个问题是off-topic .它目前不接受答案。想改善这个问题吗？ Update the question所以它是 on-topic对于堆栈溢出。 10年前关闭。 Improve this
gnu-screen - GNU Screen 终端线路设置
我想使用 GNU screen 来监视这样的串行 USB 端口: $ screen /dev/ttyUSB0 115200 但我需要调整一些终端线路设置。我已经进行了几次尝试，但似乎都没有奏效。例如，
gnu-screen - 如何创建嵌套的 screen session ？
我需要在我的 .screenrc 中放入什么才能创建嵌套 session (即:屏幕中的屏幕)？目前，如果我运行 screen再次从打开的屏幕选项卡中，而不是在该选项卡中打开一个新的屏幕 sessi
gnu-screen - 如何分离内部 screen session
我通常像这样使用 gnu 屏幕: 1. 为我的所有任务启动一个屏幕 session 2.当我登录到一台机器时，我连接到我同事制作的屏幕 session (screen -x)(因此这使它成为“内部屏幕
gnu-screen - 如何按名称列出 screen session ？
使用屏幕，我知道我可以按名称命名和重新附加到 session : screen -S screen -r 当我执行 screen -ls我得到一个 session 列表，但
gnu-screen - 如何在GNU screen 中增加回滚缓冲区的大小
如何增加screen中可以查看的行数？我想查看从运行screen -S 到当前操作的那几行。例如，如何将缓冲区长度增加到大约50000行？我已经尝试过^a :scrollback ，但是它不会增加
gnu-screen - 什么是 GNU screen ？
很难说出这里问的是什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或言辞激烈，无法以目前的形式合理回答。如需帮助澄清此问题以便可以重新打开，visit the help center . 8年前关闭
gnu-screen - 重新连接到 screen 守护进程会使退格键杀死整行
作为设置桌面的启动脚本的一部分，我初始化了一个带有多个窗口的 screen 。为此，我启动一个守护进程并向其发送 -X screen 和 -X stuff 命令，最后使用 -r 重新连接。不幸的是，
gnu-screen - 如何避免启动 screen 消息？
当我开始时 screen ，我收到以下消息: Screen version 4.00.03jw4 (FAU) 2-May-06 Copyright (c) 1993-2002 Juergen Weig
gnu-screen - 如何调整 screen 窗口的大小？
刚刚开始使用 Screen 与 Vim 进行远程配对编程。想知道是否有办法调整窗口大小，因为我们的终端空间在默认设置下非常有限。目前我正在进入这样的屏幕: User 1: screen -R te
gnu-screen - GNU screen 实际上是如何工作的
所以我一直在尝试寻找一些关于 GNU screen 实际上如何在 high 下工作的信息，而不必真正阅读源代码，但我一直无法这样做。 screen 做了什么，即使在终端 session 关闭时它也能保
linux - 在现有 screen 中创建新的 'screen'
我有一个游戏服务器。它通过 dotnet 在 linux 上运行。我在“screen ” session 中运行它。但是我正在努力重新启动此服务器。从外面看，很容易。我只是通过名称杀死现有 scree
linux - 如何使用每个 screen 的自定义命令启动多个 screen ？
我想使用 mac/linux 命令 screen 启动多个 screen ，让每个 screen 执行我的 .bashrc，然后从该 .bashrc 运行一系列别名/函数。我尝试在我的 .screen
linux - screen : how to turn on alternate screen?
当我在终端工作时，我会看到最后一个 shell 命令执行输出的历史记录。如果我运行 vim，我会看到我全屏打开的文件。当我退出 vim 时，我可以再次看到最后一个 shell 命令的历史。但是，当我
shell - sh screen - 等待 screen 终止
我正在写一个小脚本，它确实向正在运行的屏幕 session 发送命令。此命令会停止屏幕，但不会立即停止。我需要等待它完成才能继续执行脚本的其余部分。这就是我停止屏幕的方式: screen -S $S
gnu-screen - 你怎么知道你当前连接的 gnu screen session
我们在办公室经常使用 gnu screen ，有时如果我不注意，我最终会迷失在我已经在哪个 screen session 中。所以我的问题是，你怎么知道你在哪个屏幕 session 中？你有办法查吗
screen-scraping - Mozenda Screen Scraper 是如何编码的？
我想知道 Mozenda Screen Scraper 是如何编码的？ http://www.mozenda.com/screen-scraper 我展示了一个浏览器，用户可以在其中选择他想要删除的字

首页

博学

6Ren·AI

商城

screen-scraping - 防止屏幕抓取