- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试通过 Sequilize 查询数据库,然后我想使用返回的每条记录来运行 Scraping 作业(使用 puppeteer)。我希望它只逐条记录运行,就像我们开始抓取第一条记录,然后等待第一条记录完成,然后转到第二条记录。
到目前为止,这是我的代码
刮削 Controller :
exports.directFind = async (vin, res) => {
if (vin) {
let browserInstance = browserObject.startBrowser();
await scraperController(browserInstance,vin)
.then(results => {
return res(results)
});
}
};
使用刮板发送通知的功能
const sendNotif = async () => {
Vins.findAll({raw : true}).then(async (vins) => {
await vins.map(async (vin) => {
console.log(vin.vin)
await search.directFind(vin.vin,function(res) {
status.findLatestVinStatus(vin.id,function(latestVINStatus) {
if (latestVINStatus.vmacs3CharCode == res.result.order.vmacs3CharCode || latestVINStatus.gobStatusCode == res.result.order.gobStatusCode) { //to be cganged for prod
console.log("we need to send notif")
//sendEmail(res.result)
}
});
})
console.log('end')
});
})
}
谢谢
最佳答案
您可以使用 for 循环一一查看结果:
for (const vin of await Vins.findAll({raw : true})) {
await search.directFind(vin.vin, res => { // ... })
}
关于javascript - 从 Sequelize 获取查询结果,然后按结果运行刮刀作业结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68017345/
我正在使用lxml.html模块 from lxml import html page = html.parse('http://directory.ccnecommunity.org/repor
我正在使用以下 python 脚本从亚马逊抓取信息 pages . 在某些时候,它停止返回页面结果。脚本正在启动,浏览关键字/页面,但我只得到标题作为输出: Keyword Rank Title AS
因此,我尝试使用 jsoup 来抓取 Reddit 中的图像,但是当我抓取某些子 Reddits(例如/r/wallpaper)时,我收到 429 错误,并且想知道如何解决此问题。完全理解这段代码很糟
我正在尝试在 Apache Nutch 中构建爬虫和抓取工具,以查找包含讨论特定单词主题(例如“选举”、“选举”、“投票”等)部分的所有页面。 一旦我进行了抓取,Nutch 就会清除 HTML 中的停
概念: 使用带有 Python 和 Selenium 的 AWS Lambda 函数,我想通过传递 headless chrome test 创建一个无法检测到的 headless chrome 刮板
我是一名优秀的程序员,十分优秀!