persistence - 为基于 Greasemonkey 的爬虫存储数据的最佳方式？-6ren

persistence - 为基于 Greasemonkey 的爬虫存储数据的最佳方式？

转载作者：行者123 更新时间：2023-12-04 07:48:02

24

4

我想用 Greasemonkey 抓取一个站点，想知道是否有比 GM_setValue 更好的临时存储值的方法。

我想要做的是在社交网络中抓取我的联系人并从他们的个人资料页面中提取 Twitter URL。

我目前的计划是在它自己的选项卡中打开每个配置文件，使其看起来更像一个普通的浏览者(即浏览器会加载 css、scrits 和图像)。然后使用 GM_setValue 存储 Twitter URL。抓取完所有个人资料页面后，使用存储的值创建一个页面。

不过，我对存储选项不太满意。也许有更好的方法？

我已经考虑将用户配置文件插入当前页面，以便我可以使用相同的脚本实例处理它们，但我不确定 XMLHttpRequest 是否看起来与普通用户发起的请求没有区别。

最佳答案

我有一个类似的项目，我需要从网站获取大量(发票行数据)，并将其导出到会计数据库中。

您可以创建一个 .aspx(或 PHP 等)后端，它处理 POST 数据并将其存储在数据库中。

您想要从单个页面获取的任何数据都可以存储在表单中(如果需要，可以使用样式属性隐藏)，使用字段名称或 ID 来标识数据。然后您需要做的就是使表单操作成为 .aspx 页面并使用 javascript 提交表单。

(或者，您可以向页面添加一个提交按钮，允许您在提交到数据库之前检查表单值)。

关于persistence - 为基于 Greasemonkey 的爬虫存储数据的最佳方式？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/487787/

24

4

0

文章推荐： internet-explorer - IE 保护模式第三方 cookie 问题

文章推荐： memory-management - 页大小和页表条目大小有什么区别

greasemonkey - 从网页调用 Greasemonkey 函数
这个问题在这里已经有了答案: How to call Greasemonkey's GM_ functions from code that must run in the target page s
greasemonkey - 使用 Greasemonkey 脚本跨域进行本地存储
是否可以使用 Greasemonkey 脚本跨域存储数据？我想允许从使用相同 Greasemonkey 脚本的多个网站访问 Javascript 对象。最佳答案是的，这就是 GM_setvalue
greasemonkey - Greasemonkey 可以使用文件 ://protocol?
我有一个简单的 Greasemonkey 脚本: // ==UserScript== // @name hello // @namespace http://www.webmonkey.com //
greasemonkey - 如何编写 greasemonkey 脚本来删除确认对话框？
我想写一个非常简单的 greasemonkey 脚本，因为我讨厌“你确定吗？”我经常使用的网站上的 javascript 确认。我只是将它用于个人用途，不会发布它或任何东西。经过一番谷歌搜索后，我找到
greasemonkey - 包括跨多个域的 Greasemonkey 脚本
这是一个有点奇怪的具体问题。我正在编写一个可以跨十个域运行的 Greasemonkey 脚本。这些网站都具有相同的结构，但每个网站的域名不同。例如，脚本将运行: http://first-domai
greasemonkey - 如何仅运行一次 Greasemonkey 脚本
我为一个域制作了一个greasemonkey脚本，现在如何让它只运行一次？就像每次访问域时它都会启动一样，我不希望这样。如何使其仅运行一次，然后删除自身或使其处于非事件状态？谢谢。最佳答案如果您
greasemonkey - setTimeout 在 Greasemonkey 中并不总是有效
我发现了很多类似的问题，但没有一个是平等的，也没有正确的解决方案。这是一个非常奇怪的问题。我有一个简单的 Greasemonkey 脚本来测试这个问题: // ==UserScript== // @
greasemonkey-4 - 如何在 Greasemonkey 脚本中实现自动更新？
我正在写一个 Greasemonkey 脚本，如何实现自动更新？可以将脚本放入 GitHub 存储库并设置 @version数字？然后......是一些自动的方式如何做到这一点？或者我必须手动检查
greasemonkey - 如何编写用户脚本以便它们在 Opera 和 Greasemonkey 中工作
我现在正在研究用户脚本。我知道 Opera 与 Greasemonkey 脚本的许多方面兼容，但与其他方面不兼容。 GM functions emulation script在 Opera 上将需要，
greasemonkey - 为什么全局变量突然可用于 Greasemonkey 和 Tampermonkey 脚本？
最近在写一个用户脚本时，我发现页面上下文中的变量是可用的。 console.log(window) 在 Tampermonkey 和 Greasemonkey 中都没有导致错误。我很困惑。全局变量不
greasemonkey - 如何在 Firefox 57+ 上将所有 Greasemonkey 用户脚本转移到 Tampermonkey
看完后Greasemonkey recommends users to install Tampermonkey or Violentmonkey . 我已经安装了 Tampermonkey，现在我正
greasemonkey - 用greasemonkey输入一个输入值
我在一堆 div 和一个表单中包含了一些输入值。我对 js 的了解有限，想在页面加载时使用油脂猴来设置值。下面显示了获取值的 div 和表单的顺序。
greasemonkey - 保存设置的脚本
有没有办法使用用户脚本将一些设置保存到不是 cookie 的本地计算机？如果设置不是全局的，则很难制作用于多个域的用户脚本。来自评论: "I am using scriptish " 。最佳答案
Greasemonkey 脚本未更新
我有一个带有以下元块的油脂猴脚本- // ==UserScript== // @name TDF Improved Dark Skin // @namespace TDF // @incl
greasemonkey - 为什么我的Greasemonkey脚本没有更新？
我有用于Firefox的Greasemonkey脚本。该脚本包括此元块和一些代码行。我想在服务器上更新脚本，然后自动更新浏览器的脚本。 requireSecureUpdates选项已关闭。我究竟做
Greasemonkey 脚本文件夹丢失
我正在按照说明将 Greasemonkey 脚本传输到 Tampermonkey:How to Transfer All Greasemonkey userscripts to Tampermonke
greasemonkey - 如何确定为什么Greasemonkey脚本未运行
This question already has an answer here: My very simple Greasemonkey script is not running? (1个答案)
greasemonkey - 如何将用户脚本安装按钮添加到我的网页？
我需要在公司内部网站上托管用户脚本。我如何构建 href这样 Greasemonkey 会在点击链接时安装用户脚本吗？我尝试了一个简单的 Install Userscript但是 Chrome 和
greasemonkey - 如何创建在远程页面中定义的类的对象？
例如，在远程网页中，有如下代码片段: function foo(){ this.bar = 0; } 在我的油脂猴子脚本中，我想创建此类的对象: var _foo= unsafeWindow['fo
greasemonkey - 选择文本后如何调用函数
我想在文档中选择文本后调用函数。以下代码无效 var showSelWin = document.getElementById('innerwindow'); var txt = ' '; if (d

首页

博学

6Ren·AI

商城

persistence - 为基于 Greasemonkey 的爬虫存储数据的最佳方式？