- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一些 TSV 文件需要转换为 CSV 文件。 BASH 中是否有任何解决方案,例如使用 awk
来转换这些?我可以像这样使用 sed
,但我担心它会出错:
sed 's/\t/,/g' file.tsv > file.csv
如何将 TSV 转换为 CSV?
最佳答案
更新:以下解决方案不是通常可靠,尽管它们确实适用于 OP 的特定用例;请参阅底部以了解基于awk
的解决方案。
总结这些选项(有趣的是,它们的表现都差不多):
:
devnull的解决方案(在对问题的评论中提供)是最简单的:
tr '\t' ',' < file.tsv > file.csv
sed:
OP 自己的 sed
解决方案非常好,因为输入不包含带引号的字符串(可能嵌入 \t
字符。):
sed 's/\t/,/g' file.tsv > file.csv
唯一需要注意的是,在某些平台(例如 macOS)上,不支持转义序列 \t
,因此只能使用文字制表符。必须使用 ANSI 引号 ($'\t'
) 拼接到命令字符串中:
sed 's/'$'\t''/,/g' file.tsv > file.csv
awk:
awk
的警告是 FS
- 输入字段分隔符 - 必须设置为 \t
显式 - 默认行为将去除前导和尾随选项卡,并仅用单个 ,
替换多个选项卡的内部跨度:
awk 'BEGIN { FS="\t"; OFS="," } {$1=$1; print}' file.tsv > file.csv
请注意,简单地将 $1
分配给自身会导致 awk
使用 OFS
重建输入行 - 输出字段分隔符;这有效地替换了所有 \t
字符。带有 ,
字符。 print
然后简单地打印重建的行。
健壮的awk
解决方案:
作为A. Rabus指出,上述解决方案无法正确处理本身包含 ,
字符的未加引号的输入字段 - 您最终会得到额外的 CSV 字段。
下面的 awk
解决方案解决了这个问题,方法是根据需要将这些字段包含在 "..."
中(参见非健壮的 awk
上面的解决方案是对该方法的部分解释)。
如果此类字段还嵌入了 "
字符。,这些字符将转义为 ""
,符合 RFC 4180。谢谢,Wyatt Israel。
awk 'BEGIN { FS="\t"; OFS="," } {
rebuilt=0
for(i=1; i<=NF; ++i) {
if ($i ~ /,/ && $i !~ /^".*"$/) {
gsub("\"", "\"\"", $i)
$i = "\"" $i "\""
rebuilt=1
}
}
if (!rebuilt) { $1=$1 }
print
}' file.tsv > file.csv
$i ~/[,"]/&& $i !~/^".*"$/
检测包含 ,
和/的任何字段或 "
并且尚未用双引号引起来
gsub("\"", "\"\"", $i)
转义嵌入的 "
字符。将它们加倍
$i = "\""$i "\""
通过将结果括在双引号中来更新结果
如前所述,更新任何字段都会导致 awk
使用 OFS
值重建来自字段的行,即本例中的 ,
,相当于有效的 TSV -> CSV 转换; flag rebuilt
用于确保每条输入记录至少重建一次。
关于bash - 如何在 BASH 中将制表符分隔值 (TSV) 文件转换为逗号分隔值 (CSV) 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22419979/
我用 IntelliJ IDEA 2021.1 CE 在 流行!_OS 20.04 与 bash 5.0.17 . 问题造句:我将IntelliJ终端设置为/bin/bash通过 IntelliJ 设
给定如下命令: bash --shortcuts 我想显示一个快捷方式列表,就像在这个页面上一样: http://www.skorks.com/2009/09/bash-shortcuts-for-m
我有一个脚本可以操作数据、创建参数并将它们发送到第二个脚本。其中一个参数包含一个空格。 脚本1.sh: args=() args+=("A") args+=("1 2") args+=("B") .
我的脚本的“只运行一次”版本的一个非常简单的示例: ./myscript.sh var1 "var2 with spaces" var3 #!/bin/bash echo $1 #output: va
我想了解数字( double )在 bash 中是如何表示的,以及当我在 bash 中以十六进制格式打印数字时会发生什么。 根据 IEEE 754 标准,double 应由 64 位表示:52 位(1
我试图在 bash -c "..." 命令中获取 bash 脚本,但它不起作用。 如果我在 bash -c "..." 之外运行命令,它会起作用。 我需要使用 bash -c "..." 因为我想确保
如何检测我的 bash shell 中是否加载了 bash 补全包?从 bash-completion 的 2.1 版(包含在 Debian 8 中)开始,除了 BASH_COMPLETION_COM
我的 bash_profile 中有一个投影函数。现在我试图从 bash 脚本中调用这个函数,但是我得到了一个未找到的错误。如何使投影函数对 bash 脚本可见? 最佳答案 必须导出函数 export
我正在编写一个 bash 脚本,它接受许多命令行参数(可能包括空格)并通过登录 shell 将它们全部传递给程序 (/bin/some_program)。从 bash 脚本调用的登录 shell 将取
当我创建一个新的 bash 进程时,提示符默认为一个非常简单的提示符。我知道我可以编辑 .bashrc 等来更改它,但是有没有办法使用 bash 命令传递提示? 谢谢! 最佳答案 提示由 PS1、PS
好的,我希望这个问题有一定道理,但是 bash shell 和 bash 终端之间有什么区别?例子。当我第一次打开终端时,会提示我当前的目录和用户名。在终端窗口标题中显示 -bash- ,当我键入 e
我是 SBCL 的新手,我正在尝试从 bash 终端运行存储在文本文件中的 Lisp 脚本。 这是我在文件开头写的内容 http://www.sbcl.org/manual/#Running-from
我知道我们可以在 bash 中使用将十六进制转换为十进制 #!/bin/bash echo "Type a hex number" read hexNum echo $(( 16#$hexNum ))
我正在尝试在 bash 脚本中自动完成文件夹名称。如果我输入完整的文件夹名称,一切正常,但我不知道如何自动完成名称。有什么想法吗? repo() { cd ~/Desktop/_REPOS/$1 }
我想检查远程网站上的一些文件。 这里是bash命令生成计算文件md5的命令 [root]# head -n 3 zrcpathAll | awk '{print $3}' | xargs -I {}
是否有任何内置函数可以使用 bash shell 脚本从给定日期获取下周日(下周一、下周二等)?例如,2014 年 9 月 1 日之后的第一个星期日是什么时候?我预计 2014 年 9 月 7 日。
我一直在尝试根据表格重命名一些特定文件,但没有成功。它要么重命名所有文件,要么给出错误。 该目录包含数百个以长条形码命名的文件,我只想重命名包含模式 _1_ 的文件。 例子 barcode_1_bar
bash 中有没有办法用变量的内容替换文本文件中的占位符? 例如,我想发送一封电子邮件通知,如下所示: Dear Foo, Alert: blah blah blah blah blah blah
我有一个 bash 脚本,它在某些字符串上附加了一个重音字符,导致它失败,我找不到这些字符在哪里或如何进入那里。 这是一些示例输出: mv: cannot move â/tmp/myapp.zipâ
这个问题在这里已经有了答案: How do I place stdout on edit line? (1 个回答) Can a bash script prepopulate the prompt
我是一名优秀的程序员,十分优秀!