- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我可以为每个 CPU 创建更多 PhantomJS 进程 或同时为每个 phantom 进程创建 1 个以上 网页 实例吗?
例如,1:1:1 表示:1 台电脑有 4 个 CPU,我生成 4 个 PhantomJS 进程,并创建 1 个网页同时在每个进程中。
这是并发的限制。
有没有好的方法证明可以改变1:1:1的比例以及哪个比例好?
如果 phantom:page 的比例为 1:n,是否会发生上下文切换竞争条件,这会导致 PhantomJS 错误吗?
最佳答案
不存在三向比率这样的东西。比率恰好有两个方。现在我们已经解决了这个问题,让我们分割比例。
我们可以用 x 个可用线程(CPU/核心)和 y 个 PhantomJS 进程来定义 x:y。然后我们可以用 z 个 page
实例定义 y:z。
只要硬件支持(主要是RAM),您可以运行任意数量的PhantomJS进程。但对于大多数架构(全部?),当 y > x
时,相对性能 (y/x
) 会下降。当您有许多进程但核心数量较少时,则至少两个进程必须共享一个核心(如果有多线程,则必须共享一个线程)。因此,这两个过程的完成速度不会像其他过程那么快。这与 PhantomJS 无关,而是正常的多进程行为。
如果你有y >> x
,那么即使进程的上下文切换也可能成为瓶颈,一切都会变得非常慢。
始终希望只生成与您拥有的核心/线程一样多的进程(甚至可能更少)。
对于几乎所有情况,PhantomJS 进程默认独立运行。仅当它们运行的页面使用 localStorage 时,您才可能遇到问题。 localStorage 始终保留在磁盘上,并且无法更改。
page
实例PhantomJS 运行 JavaScript 脚本。由于 JavaScript 整体上是单线程的,因此无法获得任何并行处理,但可以通过正常的 JavaScript 事件循环获得并发性。
PhantomJS 支持每个进程多个 page
实例,并且效果相当好,但当然,由于 JavaScript 是单线程的,多个页面的执行是交错的。这意味着“同时”打开两个页面应该会导致逐个打开它们所需的时间大致相同。
严格来说并非如此,因为等待一个页面的资源可以让其他页面进行进一步的处理。当页面顺序打开时,某个页面等待资源加载的时间无法被其他页面使用。
另一方面,不能在一个进程中使用大量page
实例,因为不同页面的请求会互相阻碍。 HTTP 请求在 TCP 上运行。如果有多个 TCP 争夺带宽,则连接的整体效率会降低。但这应该仍然比顺序情况更快。这就是为什么 HTTP/2 (SPDY) 是个好主意。
并发处理比顺序方式更快,但是对每个 PhantomJS 进程(甚至可能是多个进程)管理多个 page
实例进行编程会更困难。
页面
实例此脚本显示请求站点的两个版本。第一次迭代的结果有很大不同,因为缓存尚未填充。缓存以后无法清除,因此每次迭代都会在第一次迭代之后使用缓存的资源。
var urls = [
'https://google.com',
'http://stackoverflow.com/contact',
'http://stackoverflow.com/questions?pagesize=15&sort=newest',
'http://www.spiegel.de/'
];
function sequential(callback) {
var copiedUrls = JSON.parse(JSON.stringify(urls)),
page = require('webpage').create(),
start = (new Date()).getTime();
function sequentialHelper(){
//console.log("seqHelp " + copiedUrls.length);
if (copiedUrls.length == 0) {
start = (new Date()).getTime() - start;
page.close();
callback(start);
return;
}
page.open(copiedUrls.shift(), function(s){
sequentialHelper();
});
}
sequentialHelper();
}
function parallel(callback) {
var copiedUrls = JSON.parse(JSON.stringify(urls)),
max = copiedUrls.length,
pages = [],
start;
function checkFin(){
max--;
//console.log("parCheck " + max);
if (0 === max) {
start = (new Date()).getTime() - start;
pages.forEach(function(page){
page.close();
});
callback(start);
}
}
start = (new Date()).getTime();
copiedUrls.forEach(function(url){
var page = require('webpage').create();
pages.push(page);
page.open(url, function(s){
checkFin();
});
});
}
var repeat = 5,
current = 0,
times = [];
function repeater(){
if (current === repeat) {
console.log(JSON.stringify(times, undefined, 4));
phantom.exit();
}
console.log("repeated: " + (current+1));
var t = {
par: (new Date()).getTime()
};
parallel(function(innerTime){
t.par = (new Date()).getTime() - t.par;
t.pari = innerTime;
t.seq = (new Date()).getTime();
sequential(function(innerTime){
t.seq = (new Date()).getTime() - t.seq;
t.seqi = innerTime;
times.push(t);
repeater();
});
});
current++;
}
repeater();
输出:
[
{
"par": 10653,
"pari": 10652,
"seq": 5304,
"seqi": 5301
},
{
"par": 2936,
"pari": 2936,
"seq": 5224,
"seqi": 5219
},
{
"par": 3167,
"pari": 3167,
"seq": 4478,
"seqi": 4474
},
{
"par": 2506,
"pari": 2506,
"seq": 6868,
"seqi": 6862
},
{
"par": 2479,
"pari": 2479,
"seq": 3753,
"seqi": 3749
}
]
关于javascript - cpu能比:phantom:page be more than 1:1:1,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29488620/
我是 PHP 新手。我在 WordPress 中遇到了这种语法.该代码的最后一行是做什么的? $page = $_SERVER['REQUEST_URI']; $page = str_replace(
为了清楚起见 - 这是我在这个问题中谈论的盒子的图片: 背景:我为客户构建了一个相对复杂的 WP 网站,它更像是一个 CMS 而不是博客,并且依赖于正在构建的页面层次结构。 (嗯,它们实际上是设置了
GitHub Help显示了 GitHub Pages 的以下选项: gh-pages 分行 主分支 master 分支/docs 文件夹 那么我们可以使用名称不是 master 或 gh-pages
我正在使用 AngularJS 框架为我的前端开发一个 Web 应用程序。对于我的登录页面,我必须阻止用户浏览除登录页面和注册之外的其他页面。但是我现在所做的代码也阻止用户导航到注册页面。以下是我的代
如果不将/1 粘贴到 url 上,是否可以改变 Zend_Paginator 来处理 URL?当前用户转到/aaron/studio。然后用户应该点击页面并开始访问 URL,例如:/aaron/stu
目前,我创建了一个可以生成PDF的系统。 PDF 中的数据来自 MySQL 数据库。现在,我像这样显示数据 第一页:仅显示一条数据。 第二页文字:将显示数据(每页最多 3 个数据) 说得更清楚一点,比
我正在尝试构建我的 ASP.NET MVC 4.5 项目以使用搜索引擎友好的 URL。我正在使用以下路由映射。 routes.MapRoute( name: "Default", ur
我为打印按钮使用了以下代码: Data.str = null; //Data.str = textBox24.Text.ToString(); string s = "select * from te
我们有一个带有两个 View 的单页应用程序(本质上是一个项目列表和所选项目的详细信息页面)。两个 View 都在单独的 html 文件中,我们使用 sammy.js 在页面之间进行转换/导航。在我们
(如果有人需要更多信息或更好的描述,请告诉我) 您好,我从这里添加了 viewPagerLibrary:http://viewpagerindicator.com/#introduction今天在我的
我是网页的新手,刚刚开始学习它。在创建新的 Razor 网站后,当我点击添加新项目时,我会看到可以添加的项目的多个选项。它们是: Layout Page(Razor) 这些类似于Master Page
我正在尝试使用 activeadmin 和 awesome_nested_set 创建页面模型。我一直在试图弄清楚如何使用正确的尾随 slug(例如/page1/page1subpage/a-subp
我正在尝试将 DotNetOpenAuth 与 Razor/MVC3 一起使用。大多数 DotNetOpenAuth HTML 助手都接受 System.Web.UI.Page 作为参数之一,使用 W
在我们的应用程序中,当我们在某些页面之间导航时,我们会在进入下一页之前发出服务器请求。发生这种情况时,当前页面上会显示加载图形。奇怪的是,在等待服务器响应完成时,下一页的样式会应用到当前页面。这会导致
我正在使用 ASP.NET Core 3.1 MVC 和 Razor 页面构建 Web 应用程序。 我是 Razor 页面的新手。 我使用上面的方法创建了一个基本应用程序。我想在应用程序启动时加载登录
我遇到了一个我似乎无法解释的问题。我在 Umbraco 中设置了一个主模板和 2 个子模板,但出现以下错误: Content controls have to be top-level control
我正在创建一个网络应用程序,允许用户选择他们当前的部门、他们将临时借调到哪个部门、他们正在执行的任务以及在任务上花费的时间。我需要写一些声明,根据他们当前部门的选择来确定他们所在的团队(当前的或新的)
当我导航到一个页面时,我得到了404错误页面,该页面说,在我刷新浏览器之前,没有包含此URL的页面,然后该页面才会显示。。我尝试使用@REACH/ROUTER来导航,而不是使用REACT-ROUTER
我正在使用 Html2Pdf 将一些 HTML 文件转换为 PDF。我还需要添加分页符来划分文档的各个部分。为此,我使用 标签。 我有以下 HTML 片段: ...
我正在使用另一个静态网站生成器,我希望能够将源文件(以markdown格式)以及生成的网站 checkin 到我的username.github.com存储库中。因此,很像Jekyll,但我没有使用J
我是一名优秀的程序员,十分优秀!