gpt4 book ai didi

javascript - 我如何使用这些 Node 模块通过文件或 URL 接受 HTML,然后输出 JSON 作为现有 HTML 元素的验证?

转载 作者:数据小太阳 更新时间:2023-10-29 05:58:18 26 4
gpt4 key购买 nike

基本上我需要做的是获取一个本地的grader.js文件,然后在命令行中使用它来输入HTML,然后输出JSON数据到控制台以验证存在几个 HTML 元素。用法看起来像这样:

./grader.js --checks checks.json --file index.html
./grader.js --checks checks.json --url http://google.com

正在使用的 Node 模块是 Commander(用于在命令行工作)、Cheerio(用于 HTML)和 ReSTLer(用于从 URL 获取 HTML)。

checks.json 文件很简单,因为它只是要求检查一些简单的 HTML 元素是否存在,以确定它们是否存在于页面上:

["h1",
".navigation",
".logo",
".blank",
".about",
".heading",
".subheading",
".pitch",
".video",
".thermometer",
".order",
".social",
".section1",
".section2",
".faq",
".footer"]

grader.js 文件让事情变得有点复杂。下面的代码实际上是有效的,因为它接受命令行参数并且确实指示关于 HTML 元素是否存在的 true 或 false 值。但是在底部添加了 URL 检查后,它不能正常工作。我的 checkURL 函数 以及我使用底部的 Commander 代码实现它的方式有问题。尽管 true 和 false 值是正确的,具体取决于我使用的 HTML 文件/URL,但即使我只想检查文件或 URL 而不是两者,我最终也会将两项检查都吐出到控制台。我对此还很陌生,所以我很惊讶它能起作用。它可能与默认值有关,但是当我尝试进行这些更改时,checkURL 函数似乎崩溃了。在此先感谢您的帮助,我真的很感激。

#!/usr/bin/env node
var fs = require('fs');
var program = require('commander');
var cheerio = require('cheerio');
var rest = require('restler');
var HTMLFILE_DEFAULT = "index.html";
var CHECKSFILE_DEFAULT = "checks.json";
var URL_DEFAULT = "http://cryptic-spire-7925.herokuapp.com/index.html";

var assertFileExists = function(infile) {
var instr = infile.toString();
if(!fs.existsSync(instr)) {
console.log("%s does not exist. Exiting.", instr);
process.exit(1); // http://nodejs.org/api/process.html#process_process_exit_code
}
return instr;
};

var cheerioHtmlFile = function(htmlfile) {
return cheerio.load(fs.readFileSync(htmlfile));
};

var loadChecks = function(checksfile) {
return JSON.parse(fs.readFileSync(checksfile));
};

var checkHtmlFile = function(htmlfile, checksfile) {
$ = cheerioHtmlFile(htmlfile);
var checks = loadChecks(checksfile).sort();
var out = {};
for(var ii in checks) {
var present = $(checks[ii]).length > 0;
out[checks[ii]] = present;
}
return out;
};

var checkUrl = function(url, checksfile) {
rest.get(url).on('complete', function(data) {
$ = cheerio.load(data);
var checks = loadChecks(checksfile).sort();
var out = {};
for(var ii in checks) {
var present = $(checks[ii]).length > 0;
out[checks[ii]] = present;
}
console.log(out);
});
}

var clone = function(fn) {
// Workaround for commander.js issue.
// http://stackoverflow.com/a/6772648
return fn.bind({});
};

if(require.main == module) {
program
.option('-f, --file <html_file>', 'Path to index.html', clone(assertFileExists), HTMLFILE_DEFAULT)
.option('-u, --url <url>', 'URL to index.html', URL_DEFAULT)
.option('-c, --checks <check_file>', 'Path to checks.json', clone(assertFileExists), CHECKSFILE_DEFAULT)
.parse(process.argv);

var checkJson = checkHtmlFile(program.file, program.checks);
var outJson = JSON.stringify(checkJson, null, 4);
console.log(outJson);

var checkJson2 = checkUrl(program.url, program.checks);
var outJson2 = JSON.stringify(checkJson2, null, 4);
console.log(outJson2);

}
else {
exports.checkHtmlFile = checkHtmlFile;
}

最佳答案

根据参数调用 checkHtmlFile()checkUrl() 之一

类似于:

if (program.url)
checkUrl(program.url, program.checks);
else checkHtmlFile(program.file, program.checks);

阅读此内容以获得更多引用:commander.js option parsing

此外,checkJson2undefined 因为 checkUrl() 没有返回任何东西。

关于javascript - 我如何使用这些 Node 模块通过文件或 URL 接受 HTML,然后输出 JSON 作为现有 HTML 元素的验证?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17574679/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com