Linux 按行数拆分文本文件，保留换行符-6ren

Linux 按行数拆分文本文件，保留换行符

转载作者：太空宇宙更新时间：2023-11-04 12:07:15

27

4

我是 linux 的新手(不是我自己的服务器)，我想通过从第三方应用程序调用 bash 脚本来拆分一些 windows txt 文件:

到目前为止，我在某种程度上以两种方式工作:

split -l 5000 LargeFile.txt SmallFile

for file in LargeFile.*
do
    mv "$file" "$file.txt"
done

awk '{filename = "wrd." int((NR-1)/5000) ".txt"; print >> filename}' LargeFile.txt

但两者都给我 txt 文件，结果是:

1行2行3行4

我找到了一些关于像这样放置 LargeFile.txt $ (LargeFile.txt) 的主题，但它对我不起作用。 (我还找到了一个swich，让split命令直接生成txt文件，但这也行不通)

我希望有人能帮我解决这个问题。

最佳答案

解释:行终止符

正如对 this question 的各种回答所解释的那样，标准行终止符在操作系统之间不同:

Linux 使用LF(换行，0x0a)
Windows 使用CRLF(回车换行0x0d 0x0a)
Mac，OS X 之前使用 CR(回车 CR)

要解决您的问题，重要的是要弄清楚 LargeFile.txt 使用的行终止符。最简单的方法是 file 命令:

file LargeFile.txt

输出将指示行终止符是 CR 还是 CRLF，否则只是说明它是一个 ASCII 文件。

因为 LF 和 CRLF 行终止符将在 Linux 中被正确识别，并且行不应该出现合并在一起(无论您使用哪种方式查看文件)，除非您专门配置一个编辑器以便他们这样做，我将假设您的文件具有 CR 行终止符。

您的问题的示例解决方案(假设 CR 行终止符)

如果你想在 shell 中使用 shell 命令拆分文件，你可能会遇到 cat、split、awk 这样的问题 等首先不会识别行结尾。如果您的文件非常大，这可能还会导致内存问题 (?)。

因此，处理此问题的最佳方法可能是首先转换行终止符(使用 tr 命令)，以便它们在 Linux 中被理解(即转换为 LF )，然后在将行终止符翻译回来之前应用您的 split 或 awk 代码(如果您认为需要这样做)。

cat LargeFile.txt | tr "\r" "\n" > temporary_file.txt
split -l 5000 temporary_file.txt SmallFile
rm temporary_file.txt
for file in `ls SmallFile*`; do filex=$file.txt; cat $file | tr "\n" "\r" > $filex; rm $file; done

注意最后一行实际上是一个for循环:

for file in `ls SmallFile*` 
do 
    filex=$file.txt 
    cat $file | tr "\n" "\r" > $filex
    rm $file
done

这个循环将再次使用 tr 来恢复 CR 行终止符，并另外给生成的文件一个 txt 文件名结尾。

一些说明

当然，如果您想保留 LF 行终止符，则不应执行此行。

最后，如果您发现您有不同类型的行终止符，您可能需要调整第一行中的 tr 命令。

tr 和split(还有cat 和rm)都是GNU coreutils 的一部分并且应该安装在您的系统上，除非您处于非常不典型的环境中(也许是初始 RAM 磁盘的救援外壳)。 file 命令也是如此(通常应该可用)，this one .

关于Linux 按行数拆分文本文件，保留换行符，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50260223/

27

4

0

文章推荐： html - div 没有占用它所有的物理空间

文章推荐： python - API 一段时间后停止工作

文章推荐： java - 给出给定数字的偶数、奇数和零

Gnuplot columnstacked 直方图 - 行数/行数
我有一个包含未定义条目数的数据文件，如下所示: A B C D E.. 1 0 2 5 4 7 4 3 4 1 8 7 4 0 7 1 1 第一行代表工作时间，而不是暂停等交替方式。为了可
c# - SQL 查询 : Select Column1, 行数 (criteria1),行数 (criteria2)
我需要有关小型 SQL 查询的帮助。考虑下表: TicketNo | Rules | Audit Result --------------------------------- P
MySQL 行数
我有一个非常大的表(~1 000 000 行)和带有联合、连接和 where 语句的复杂查询(用户可以选择不同的 ORDER BY 列和方向)。我需要获取分页的行数。如果我运行查询而不计算行数，它会很
DataFrames.jl 行数
我想获取数据帧的行数。我可以通过 size(myDataFrame)[1] 实现这一点. 有更干净的方法吗？最佳答案如果您正在使用 DataFrames具体来说，那么你可以使用 nrow() :
带有千位分隔符的状态栏中的 VIM 行数？
是否可以在带有千位分隔符的 VIM 状态栏中显示行数，最好是自定义千位分隔符？例子: set statusline=%L 应该导致“1,234,567”而不是“1234567”。最佳答案我找到了
php mysqli 行数
我有一个非常基本的问题，但不知道该怎么做。如果 mysql 表中的行数增加，我想刷新页面。我已经尝试了一些不同的事情，比如在表中添加一个单独的列，如果行数和这个值相等，则值为 (id + 1)，然后进
Mysql - 自动增量和没有的区别。行数
我的 mysql TB 中的行数(如 TB 信息中所示)是 11093，而自动递增 ID(从 1 开始)是 11361。为什么会这样？最佳答案删除的行不会重置 AI 索引。行数是当前表中的条目数，
不同年龄段的 MySQL 行数
我有一个 MySQL 表如下。 emp_no emp_name dob gender 1 A 1978-10-10 Male 2 B
C++ fileIO 行数
ifstream inFile; inFile.open(filename); //open the input file stringstream strStream; strStream << i
mysql - EXISTS 行数
SELECT * FROM table1 WHERE EXISTS (SELECT * FROM table2 WHERE *condition*) 例如，我可以检查是否有 3 行符合 table2
mysql - SQL 行数
我正在尝试提取 SQL 表中的总行数。我正在使用以下代码: $rowNum = mysql_query("SELECT COUNT(*) FROM Logs"); $count = mysql_fe
iphone - UITableView 行数
我想知道表格 View 的行宽是多少，UITableViewCell 文本标签的字体是什么，有人可以帮我吗？最佳答案 NSLog(@"width: %f", cell.frame.size.widt
文件中的 Python 行数
对于以下内容: def linecount(filename): count = 0 for x in open(filename): count += 1 r
计算文件中的字数、行数、字符数
感谢关注。我用C语言写了一段代码来统计字数、行数和字符数。 while((c = fgetc(fp)) != EOF) { if((char)(c) == ' ' || (char)(c)
matlab - 如何获得这个matlab矩阵的长度(行数)？
我是 matlab 的新手，只需要更改代码中的一个非常小的东西。我有以下矩阵: ans = 1 1 1 1 2 1 2 1
php - 准备好的语句 - 行数
我只是想弄清楚如何确定行数，然后使该数字显示在 HTML 中。我准备好的声明如下所示: if($stmt = $mysqli -> prepare("SELECT field1, field2, f
PHP PDO - 行数
PDO 显然无法计算从选择查询返回的行数(mysqli 有 num_rows 变量)。除了使用 count($results->fetchAll()) 之外，有没有办法做到这一点？最佳答案根据手
sql - 如何计算 SQL 行数
SELECT count(*) FROM Stack WHERE Id = 33478 GROUP BY SID Output: (No column name) 1 4 对于结果；有两排。怎么退货
sql - 将表分区真正受益的大小(行数)是多少？
IE。如果我们有一个包含400万行的表。其中具有一个STATUS字段，该字段可以采用以下值:TO_WORK，BLOCKED或WORKED_CORRECTLY。您是否会在一个仅会更改一次的字段上进行
java - 如何获取 JTextPane 行数
所以在JTextArea中有一个getLineCount()是否有与JTextPane类似的东西，因为我可以找到任何东西。也许有不同的方法来获得它？我想获取当前存在的行数。最佳答案 (正如您所指出的

首页

博学

6Ren·AI

商城

Linux 按行数拆分文本文件，保留换行符