- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个HTML页面,该页面可以通过将外部页面放置在url中的链接进行访问-例如
http://www.mydomain.com/mypage?external-page=encodedURL
我的页面有责任从处理的网址中抓取一些数据。
如何使用javascript / jquery访问传入的页面?我需要能够提取某些类和ID的内容。
这是否违反原产地政策?如果是这样,还有其他方法可以处理这样的外部页面吗?我觉得很奇怪,我可以在浏览器或终端命令中访问网页并接收内容,但不能在js文件中接收。
最佳答案
您可以使用浏览器扩展来抓取外部页面,然后将数据发送到您的站点,或在页面中显示它,以便页面的javascript可以通过DOM对其进行访问。
您可以在域上使用代理,该代理可获取外部页面并将其交给源于您域的javascript。
您可以对可访问的外部页面使用API。
您可以要求命令更改外部页面的代码(如果可以访问)以使用Access-Control-Allow-Origin = *来提供页面
我认为这就是您所能做的。
编辑:“似乎很奇怪”是直到您意识到用户和进程之间的预期差异。认为用户不是恶意的,但可以是一个过程。例如,如果某个进程有权访问外部页面,则该进程可以从用户已登录的gmail会话中获取数据,然后将该数据传输到服务器。由于终端上的用户可能是(但不一定总是!)登录该会话的用户,因此该用户不被认为是恶意的。但是,源于用户导航到某个网站的脚本不应以与该用户相同的权限进行操作。由于该脚本也是一个代理,可以执行操作,但是它不是由用户创建或指导的。这是隔离原产地和相同原产地政策的最强烈原因。
例
书签和IFrame的执行上下文
如果要通过书签将JS注入每个页面,则该注入的代码的行为就好像它与页面的其余部分(至少是页面的“顶部框架”)具有相同的来源。它将在与顶部框架相同的上下文中执行。如果页面中存在嵌套的iframe,则如果您的书签试图插入到页面中,则将收到“从此页面访问x的不安全尝试”错误。这是因为小书签的来源位于首页,并且首页也永远无法访问不同域上的嵌套iframe。
因此,如果您要抓取的网站的某个部分位于顶部框架下方的iframe中,则您的小书签将无法获取。
使用书签发送数据
如果要在域的一个页面上获取一个URL,然后从另一个域的该URL中获取数据,然后将该数据显示在同一页面上,则需要一种获取数据的方法。您可以使用书签,但是流程仍将涉及一些“用户帮助”。它会像这样:
加载域的页面D。用户在输入框中输入一个URL。点击提交。
D上的Javascript打开一个新的标签/窗口,指向用户提供的URL。
用户在该外部页面上单击您的抓取书签,从而收集所需的数据X。
所需数据X通过Ajax发送到会话标识符为I的“服务器”S。
页面D轮询服务器S,直到它被通知已捕获具有会话标识符I的某些数据,然后它获取该数据并将其显示在D上。
需要服务器。您不能使用本地存储来传输信息,因为这是特定于域的。有一个替代方案,不需要服务器。它需要进行浏览器扩展。
使用浏览器扩展程序传输数据扩展程序的“后台页面”与所有浏览器选项卡的本地服务器基本相同,它允许跨针对不同域的选项卡传输信息。此设置中的“客户端”是“内容脚本”,它会加载到每个页面(就像书签一样,只是不需要用户实际单击该书签来加载它。它会自动发生)。流程如下所示:
页面D再次。用户在输入框中输入网址。单击提交->会触发扩展中的一些代码。
扩展程序后台页面指示一个选项卡打开并将其定位到url。
内容脚本会自动加载到该选项卡中,并在后台检查应获取的数据。它获取该数据,并通过一条消息(一个json字符串)将其发送到后台页面。
后台页面将该通知和数据推送到页面D上的原始内容脚本中。该脚本显示信息。
(可选)后台页面还将信息发送到服务器,以保存到该用户的数据存储中。
我用于浏览器扩展“背景页面”和“内容脚本”的语言主要集中在Google Chrome上。 Safari和Firefox也提供相同的概念。如果要支持IE,则必须制定其他措施。 IE10甚至不打算支持扩展。
关于javascript - 外部页面上的访问元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15260932/
如何指示 webpack 排除所有 d3 模块? // does not work externals: { "d3-*": "d3" } 所以如果应用导入了d3-submod
这个问题在这里已经有了答案: 9年前关闭。 Possible Duplicate: What does “outer =>” really mean? 我在哪里可以找到有关信息 trait After
这是一个简单的循环,我正在尝试对性能进行基准测试。 var extremeLoop=function(n){ var time=new Date() var t=0; for(
问题+概述 下面是两个片段,其中包含最初隐藏的 div,然后通过单击 button 和 jQuery 的 .show() 显示。两个 div 都具有由外部样式表应用的 display: grid; 样
我有一个 HTML 页面和一个单独的 .js 文件,该文件包含在带有 的页面中标签。 这是我的 .js 文件: element = document.getElementById("test");
我在 linux 静态库项目中有 3 个文件,我想在两个类方法实现文件中使用的静态字段存在链接问题。我有 class1.h、class1main.cpp 和 class1utils.cpp。 clas
我正在尝试将颜色背景更改为默认背景颜色,当我点击输入框外 我尝试使用“null”或“none”但没有用? window.addEventListener('click', outsideClick);
我正在编写一个应用程序,要求用户在手机上选择各种类型的文件。我使用此代码启动文件选择器 Intent : Intent intent = new Intent(Intent.ACTION_GET_C
在 android 中,不可移动(内部)的外部存储和内部存储有什么区别?我不确定在哪里保存我的数据。我只需要保存一个人可以随时提取的游戏统计数据 谢谢 最佳答案 在许多较新的设备中,将不再有物理区别,
在 C++ 中,假设我们有这个头文件: myglobals.h #ifndef my_globals_h #define my_globals_h int monthsInYear = 12; #en
我正在尝试使用 externs 在 C++ 中连接到 Ada。这两种实现有什么区别? 实现A namespace Ada { extern "C" { int getN
这个问题在这里已经有了答案: Get selected element's outer HTML (30 个答案) 关闭 2 年前。 想象一下我们有这样的东西: Hello World 如果我们这样
假设我在模块的顶部有这个: Public Declare Function getCustomerDetails Lib "CustomerFunctions" () As Long 如果我从 VB6
我目前正在使用这段代码: var wordRandomizer = { run: function (targetElem) { var markup = this.creat
我们正在使用 SVN 试水,并以 Beanstalk 作为主机。我们的设置如下所示: 存储库:模块 模块一 模块二 模块 3 存储库:网站1 自定义网站代码 svn:对模块 1 的外部引用 svn:对
有没有办法在负载均衡器中设置自动外部 IP 分配给像谷歌这样的服务? 我在裸机上运行 Kubernetes。 谢谢 最佳答案 使用 nodePort 类型的服务,它会将您的服务绑定(bind)到所有节
是否有可能在 Controller 之外使用 generateUrl() 方法? 我尝试在带有 $this->get('router') 的自定义存储库类中使用它,但它没有用。 更新 我在这里找到了一
我目前正在尝试通过 Webpack 外部对象外部化 Angular 依赖项来缩短构建时间。到目前为止,我已经为 React 和其他小库实现了这一目标。 如果我只是移动 '@angular/compil
我想创建一个自动应用其他插件的插件(外部插件)。这要求在我称为“应用插件”之前为插件设置构建脚本依赖项。但是似乎我无法在插件中添加buildscript依赖项,或者得到了: 您不能更改处于未解析状态的
我是R包的创建者EnvStats . 有一个我经常使用的函数,叫做 stripChart .我刚开始学习ggplot2 ,并在过去几天里仔细研究了 Hadley 的书、Winston 的书、Stack
我是一名优秀的程序员,十分优秀!