node.js - 处理 CSV 文件困难、浏览器超时-6ren

node.js - 处理 CSV 文件困难、浏览器超时

转载作者：太空宇宙更新时间：2023-11-04 01:41:17

25

4

我被要求每天从服务器导入一个 csv 文件，并将相应的 header 解析到 mongoose 中的相应字段。

我的第一个想法是让它通过调度程序自动运行 cron模块。

const CronJob = require('cron').CronJob;
const fs      = require("fs");
const csv     = require("fast-csv")

new CronJob('30 2 * * *', async function() {
  await parseCSV();
  this.stop();
}, function() {
  this.start()
}, true);

接下来，parseCSV()函数代码如下:(我简化了一些数据)

function parseCSV() {
  let buffer = [];

  let stream = fs.createReadStream("data.csv");
  csv.fromStream(stream, {headers:
        [
              "lot", "order", "cwotdt"
        ]
  , trim:true})
  .on("data", async (data) =>{
        let data = { "order": data.order, "lot": data.lot, "date": data.cwotdt};

        // Only add product that fulfill the following condition
        if (data.cwotdt !== "000000"){
              let product = {"order": data.order, "lot": data.lot}
              // Check whether product exist in database or not
              await db.Product.find(product, function(err, foundProduct){
                    if(foundProduct && foundProduct.length !== 0){
                          console.log("Product exists")
                    } else{
                          buffer.push(product);
                          console.log("Product not exists")
                    }    
              })
        }
  })
  .on("end", function(){
        db.Product.find({}, function(err, productAvailable){
              // Check whether database exists or not
              if(productAvailable.length !== 0){
                    // console.log("Database Exists");
                    // Add subsequent onward
                    db.Product.insertMany(buffer)
                    buffer = [];
              } else{
                    // Add first time
                    db.Product.insertMany(buffer)
                    buffer = [];
              }
        })
  });
}

如果csv文件中只有几行行，但仅仅达到2k行，这不是问题，我遇到了问题。罪魁祸首是由于if监听事件处理程序时进行条件检查 on ，它需要检查每一行以查看数据库是否已包含该数据。

我这样做的原因是，csv 文件将添加新数据，如果数据库为空，我需要第一次添加所有数据，或者查看每一行，只将这些新数据添加到 mongoose 中。

我从这里所做的第一种方法(如代码中所示)是使用 async/await确保在继续事件处理程序之前已读取所有数据 end 。这有帮助，但我不时看到(使用 mongoose.set("debug", true); )，某些数据被查询两次，我不知道为什么。

第二种方法是不使用 async/await功能，这有一些缺点，因为数据没有完全查询，它直接进入事件处理程序 end然后insertMany一些能够被插入缓冲区的数据。

如果我坚持使用当前的方法，这不是问题，但查询将需要 1 到 2 分钟，更不用说如果数据库不断增长，时间会更长。因此，在查询的那几分钟内，事件队列被阻塞，因此当向服务器发送请求时，服务器超时。

我用过stream.pause()和stream.resume()在此代码之前，但我无法让它工作，因为它只是直接跳到 end首先是事件处理程序。这会导致缓冲区自 end 以来每次都是空的。事件处理程序在 on 之前运行事件处理程序

我不记得我使用过的链接，但我从中获得的基础知识是通过这个。

Import CSV Using Mongoose Schema

我看到了这些帖子:

Insert a large csv file, 200'000 rows+, into MongoDB in NodeJS

Can't populate big chunk of data to mongodb using Node.js

与我需要的类似，但对我来说有点太复杂了，无法理解发生了什么。好像使用 socket或child process或许？此外，我仍然需要在添加到缓冲区之前检查条件

有人愿意指导我吗？

编辑:await 已从 console.log 中删除因为它不是异步的

最佳答案

fork 子进程方法:

当网络服务收到 csv 数据文件请求时，将其保存在应用程序中的某个位置
fork 子进程 -> child process example
将文件 URL 传递给 child_process 以运行插入检查
当子进程处理完 csv 文件后，删除该文件

就像 Joe 所说的那样，当存在大量(数百万)元组时，对数据库建立索引会大大加快处理时间。

关于node.js - 处理 CSV 文件困难、浏览器超时，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52818093/

25

4

0

文章推荐： python - 无效的 SUDS 信封

文章推荐： javascript - 服务器不理解所请求的操作。 (AWS)

java - 如何将 IE 浏览器 session 切换到 Chrome 浏览器 session ？
我的“登录”是在 IE 浏览器中进行的，登录后，如果我单击链接，它们就会在 Chrome 浏览器中打开。如何在同一个测试用例中将我当前的浏览器从 IE 切换到 Chrome。如果我创建一个 chrom
css - 在 Firefox 中，与 css 内容属性一起使用的特殊字符比在 Firefox 中更薄。浏览器/浏览器
您好，我不明白在 Firefox 的内容属性中使用的特殊字符的不同显示行为。我已经剥离了一切并创造了一支笔: http://codepen.io/rpkoller/pen/Fbgav 在其“基本形式”
java - Spring Data REST - HAL 浏览器 - 返回 HAL 浏览器 HTML 而不是 API 的根
我正在研究 Spring Data REST，特别是 HAL 浏览器。我一直在关注 http://docs.spring.io/spring-data/rest/docs/current/refere
Jquery if 浏览器
我正在使用工具提示，在 ie 上出现定位错误。我放了jquery浏览器代码我的工具提示 $('.tooltip').tooltip({ position: "bottom center"
javascript - bluebirdjs协程错误处理(浏览器)
我应该如何处理蓝鸟协程中的错误？我使用co in节点已有一段时间，它具有出色的捕获功能。 co(function*() { return new Promise(function(resol
JavaFX WebView 浏览器
package webviewbrowser; import java.util.List; import javafx.application.Application; import javafx.
javascript - 浏览器/JavaScript同源策略如何应用于二级域名？
我有一些 JavaScript 在同一域上的两个独立服务器之间共享请求。 .com 是 JavaScript 中域的要求吗？在这种情况下，两台服务器都位于 .abc.tyy 域上，tyy 通常是 .
JavaFX WebView 浏览器
package webviewbrowser; import java.util.List; import javafx.application.Application; import javafx.
构建以前版本的 Chromium 浏览器
我正在尝试构建仍支持 NPAPI 的先前版本的 Chromium 浏览器。我已经获得了代码，并且可以使用 stand build 命令在我的 mac 上构建最新版本的 Chromium gclient
python - Python 浏览器
我环顾四周，找不到 browscap 的 Python 等效项(我在 PHP 中使用它来检测给定的用户代理字符串是什么浏览器。我希望我不必自己写......:P 最佳答案看看这个，它应该做你想要的
javascript - 浏览器 - 文件编写器扩展？
是否有任何 chrome 或 firefox 扩展允许 javascript 在客户端 PC 中创建写入文件？最佳答案你想做什么？ HTML5 有一个 File API .这是最好的解决方案，因为
javascript - 浏览器/选项卡关闭检测时发出警报
当我点击链接或刷新或关闭标签页时，我有这段代码会发出警报。但我需要在关闭窗口(选项卡)上仅发出警报。怎么做？我的网站上有很多外部和内部链接。
javascript - Angular +浏览器
我目前正在尝试使用 Browserify + Angular，但我遇到了一个奇怪的问题。我在我的 Controller 的子目录中创建了一个名为 controllers/start-controlle
testing - 响应式布局针对哪些设备/浏览器
我正在为客户(项目已被接受，但现在是解释不同功能的问题)写一份详细的估算，以开发一个响应式布局的网站。这不是我第一次进行此类开发，但这是一个关键客户，必须铺平道路。布局将从 300px 宽度调整到
css - 浏览器/网络邮件客户端中的默认打印样式
我在时事通讯上设计了一些黑底白字。由于时事通讯在打印时看起来不错且可读。我需要使布局和文本与浏览器中的内容相似。通常情况下，黑色文本和无背景颜色是浏览器/网络邮件客户端的默认打印样式吗？最佳答案
Android 浏览器 - 无法将输入文本从白色更改为黑色
我有一个使用 GWT/mGWT 构建的移动友好网络应用程序。该应用程序有白色输入文本框和深灰色输入文本。但是，在 Android 浏览器上，文本显示为白色，因此是不可见的。我尝试的所有 CSS 都无法
javascript - 浏览器 - 强制重新加载删除cookie？
我创建了一个带有选择输入的页面来更改正在使用的 jQuery UI 主题。当主题更改时，它会存储在 cookie 中。页面加载时，如果 cookie 存在，则恢复主题，否则加载默认主题。当我使用 F
css - 浏览器/渲染引擎如何知道在哪里连接单词？
在我的 CSS 中，我使用了以下代码片段: word-break: break-word; -webkit-hyphens: auto; hyphens: auto; 渲染引擎如何知道在所有不同语言中
CSS WordPress 浏览器
我的网络浏览器 Safari 有问题，我在 Chrome、FireFox 中测试了我的网站。 Safari 版本也是正确的，但是，当需要在 1920x1080 或更高分辨率下对其进行测试时，它无法正常
PHP headless 浏览器？
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit

首页

博学

6Ren·AI

商城

node.js - 处理 CSV 文件困难、浏览器超时