gpt4 book ai didi

unicode - 使用awk去除字节顺序标记

转载 作者:行者123 更新时间:2023-12-03 04:48:14 25 4
gpt4 key购买 nike

awk 脚本(大概是单行代码)如何删除 BOM看起来像?

规范:

  • 打印第一行之后的每一行 (NR > 1)
  • 第一行:如果以 #FE #FF#FF#FE 开头,则删除它们并打印其余部分

最佳答案

使用 GNU sed(在 Linux 或 Cygwin 上):

# Removing BOM from all text files in current directory:
sed -i '1 s/^\xef\xbb\xbf//' *.txt

在 FreeBSD 上:

sed -i .bak '1 s/^\xef\xbb\xbf//' *.txt

使用 GNU 或 FreeBSD sed 的优点:-i 参数意味着“就地”,并且无需重定向或奇怪的技巧即可更新文件。

在 Mac 上:

This awk solution in another answer works ,但是上面的 sed 命令不起作用。至少在 Mac (Sierra) 上 sed 文档没有提到支持十六进制转义 ala \xef

通过管道连接到moreutils中的sponge工具,任何程序都可以实现类似的技巧。 :

awk '…' INFILE | sponge INFILE

关于unicode - 使用awk去除字节顺序标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1068650/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com