gpt4 book ai didi

csv - 使用 Miller 按列拆分巨大的 CSV

转载 作者:行者123 更新时间:2023-12-04 14:46:57 26 4
gpt4 key购买 nike

我需要每天拆分包含 50K+ 列的巨大 (>1 Gb) CSV 文件。

我找到了Miller作为此类任务的有趣且高性能的工具。

但我被米勒的文档困住了。

如何将一个 CSV 拆分为 N 个较小的 CSV 文件,其中 N 是我的源文件中的多行?

最佳答案

试试这个脚本

mlr --csv put -S 'if (NR % 10000 == 0) {$rule=NR} else {$rule = ""}' \
then fill-down -f rule \
then put -S 'if ($rule=="") {$rule="0"}' \
then put -q 'tee > $rule.".csv", $*' input.csv

在新文件夹中复制 CSV,然后在其上运行此脚本。它将为每 10000 行生成一个 csv 文件。

关于csv - 使用 Miller 按列拆分巨大的 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55685497/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com