- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要使用Apify和 Zapier自动执行 i) 登录受密码保护的网页和 ii) 单击按钮。我该怎么做?
我认为我应该在 Actor 中使用 Puppeteer,但我不确定如何使用。
目标 URL 会不时更改。它们的格式是 https://studio.example.com/products/videocloud/media/videos/{id_code}
其中 {id_code}
例如是 6091481925001
.
Zapier 应该调用 Apify Actor 来完成工作。现有 zap 中的操作已经可以访问动态 {id_code}
。附加操作应该“运行 Actor”到 Apify,传递 {id_code}
或完整的 URL https://studio.example.com/products/videocloud/media/videos/6091481925001
到 Apify 上运行。
如何通过“Input Body”将值正确传递给 Apify?
在未经身份验证的情况下访问时,页面重定向到登录表单,位于 https://signin.example.com/?redirect=https%3A%2F%2Fstudio.example.com%2Fproducts%2Fvideocloud%2Fmedia% 2Fvideos%2F6091481925001
有:
input
with id="email"
and name="email"
)input
with id="password"
and name="password"
)id="signinButton"
和 type="submit"
的按钮
)这里如何使用Actor登录?
一旦通过身份验证,目标页面就会出现。它有一个按钮栏,包括按钮“Activate”(button
其子 span
文本必须只有在允许我们单击它时才为“Activate”)。
(有关信息 - 单击后,按钮文本应变为“停用”)。
如何让 Apify 点击此处的“激活”按钮?
据我所知,这不是一个抓取的工作,因为我不想从网页返回数据,所以我不应该使用 apify/puppeteer-scraper或 apify/web-scraper .
到目前为止,我有以下内容。但是,Apify 内部的 Puppeteer 超时 - 相当长的值高达 9000 毫秒,这表明它不一定是页面加载问题(?)
const Apify = require('apify');
Apify.main(async () => {
// Get credentials
const { EMAIL, PASSWORD } = Apify.getEnv(); // Docs for using values: https://apify.com/docs/actor#source-env-vars
// Launch Puppeteer
const browser = await Apify.launchPuppeteer();
const page = await browser.newPage();
await page.goto('https://signin.example.com/login');
// Login
await page.type('#email', process.env.EMAIL);
console.log('Attempted to enter email');
await page.type('#password', process.env.PASSWORD);
console.log('Attempted to enter password');
await page.click('#signinButton');
console.log('Attempted to click button');
// Times-out here
await page.waitForNavigation();
console.log('Attempted to wait for navigation');
// Get cookies
const cookies = await page.cookies();
console.log('Attempted to wait for cookies');
await browser.close();
console.log('Done.');
});
最佳答案
1) 您可以将任意 JSON 传递给输入。只传递 as 是有意义的
{
"id_code": "ID_CODE_FROM_ZAPIER"
}
2) 在 Apify 方面,您需要先阅读输入
const input = await Apify.getInput();
const { id_code } = input;
然后您需要获取您的凭据。如果它们不改变,我会将它们保存为 Actor 的环境变量。如果您将它们命名为 EMAIL
和 PASSWORD
,您就可以通过以下方式在代码中访问它们
const { EMAIL, PASSWORD } = Apify.getEnv();
现在您需要启动 Puppeteer,转到登录页面,填写输入字段并单击提交。这很简单,示例显示在这个 article 中.您现在无需担心 cookie。
3) 登录后,您需要通过
转到所需的 URLawait page.goto(`https://studio.example.com/products/videocloud/media/videos/${id_code}`)
要在没有有用的选择器时找到要单击的确切元素,可以使用 JQuery 并查找文本。我无法登录,所以我不能 100% 确定这会起作用。
// We need to inject JQuery first
await Apify.utils.puppeteer.injectJQuery(page);
// We can use JQuery only in the browser context, which means inside evaluate
await page.evaluate(() => {
$('button:contains("Activate")').click()
})
关于puppeteer - 如何使用 Apify 登录站点并单击按钮?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58218563/
我最近刚跨过木偶继承。围绕它的几个问题: 使用p继承是一种好习惯吗?一些经验丰富的木偶同事告诉我,木偶的继承不是很好,我不太相信。 来自OO世界,我真的很想了解木偶继承的原理,以及覆盖的原理。 最佳答
需要一个 puppet 特工联系一些不同 puppet 师。 原因:不同的组创建了不同且独立的 list 集。 可能的组及其任务 应用程序供应商:应用程序的配置 安全性:强化 运营:路由表、监控工具
您可以在 puppet 中制作子模块吗,例如... puppet_root - modules - module_1 - submodule - manifes
在执行类 mypackage 中的代码之前,我需要执行类 mysql,tomcat。在我的 site.pp 我有 node 'node1' { include mysql,mypackage,tomc
我试图从失败的请求和js错误中收集数据。 我正在使用以下网站:https://nitzani1.wixsite.com/marketing-automation/3rd-page 该网站有一个对htt
我在 Suse 11 Linux 机器上使用 puppet 2.7.19 和 facter 1.6.0。 $::osfamily因子变量未设置,尽管它确实有 $::operatingsystem事实集
我正在使用 Puppet 开源版本。 我发现 Puppet 3.7.5 中有几个组件: puppet 大师 puppet 代理 MCollective 希拉 puppet 数据库 但我不知道他们是如何
主要目标是自动添加所有 puppet 模块,以便可以使用一个命令启动所有 dev-env 和 prod-env。如何通过 puppet manifest 安装 puppet 模块? 最佳答案 我们一直
我的 Puppet list 中有一系列 exec: 第一个下载带有二进制文件的 ZIP 文件(除非已经安装了二进制文件)并将其保存到 /tmp。 第二个将其解压缩。 当我第一次应用 list 时,它
我使用 aws opsworks 创建了 puppet master。我可以将 ami linux 节点自动添加到 puppet master。 当我尝试通过此链接 https://puppet.co
关于 this 的另一个问题问题。 有没有办法puppet module install从我已经下载到磁盘的本地存储库安装的工具? 最佳答案 您可以使用Puppet Library托管您自己的私有(p
我可以通过 Puppet Enterprise Master 到 Agent 运行几乎所有其他命令,但更新命令不会运行。据我所知,PE确实以root身份运行。 有人可以建议如何让这个命令在 Linux
我只想在 puppeteer 中刚刚打开的页面中应用标题,而不是在所有内部页面标题中应用标题 page.setExtraHTTPHeaders({ 'X-Just-Must-Be-Req
有没有什么方法可以用 Puppet 的语言声明数组中的包应该按照它们在数组中给出的顺序安装? 我想自动安装 CUDA,这需要 nvidia-driver-latest-dkms、cuda 和 cuda
鉴于这个简化的 Puppet 示例,很明显,由于 ~> 链接运算符,对 my_file 的任何更改都会触发 my_service 刷新: package { 'my_package': } -> fi
我是第一次使用 puppeteer,而不是工程师/程序员! 我已经能够生成我尝试使用 puppeteer 的大部分表单,但是我被单选按钮卡住了。网络表单中的开发人员工具显示该字段的以下内容: 使用:
如果您为代理在后台运行时执行 puppet agent -t,我们可以在其中看到更改的日志文件在哪里,而不是在 puppet 仪表板上。 我查看了 puppet.conf 并在主要部分看到了 logd
我正在尝试使用 exec 资源类型来执行批处理文件。但我想将变量 $dsn_64bit 的值从 init.pp 传递到 install.pp。请让我知道如何实现: 这是我的 init.pp class
我正在尝试使用 list 将用户分配到多个组,但遇到了障碍。 尝试 1: class usergroup { group { "user_one": ensure => present
我想先说我是 puppet 的新手。我一直在通过 vagrant 使用它并且我开始对写作表现感到自在,但我可能缺乏可以回答我的问题的经验或直觉。 我试图掌握 puppet 的范围以及画线的位置。我对这
我是一名优秀的程序员,十分优秀!