gpt4 book ai didi

ubuntu - 从文件中删除所有非 utf-8 字符,终端中没有输出

转载 作者:行者123 更新时间:2023-12-02 03:40:28 24 4
gpt4 key购买 nike

我是一个新的 Ubuntu 用户,正在处理一个非常大的文件,其中包含一些可以安全跳过的非 utf8 字符。我发现了另一个堆栈溢出问题How to remove non UTF-8 characters from text file这提供了一种使用命令

删除这些字符的方法
iconv -f utf-8 -t utf-8 -c file.txt

但是,由于我的文件大小,这会输出每一行,这会花费太多时间。我对 Ubuntu 命令不太熟悉,所以如果有人可以指导我修改该命令以抑制输出,我将不胜感激

最佳答案

使用 shell 重定向将转换结果输出到新文件:

iconv -f utf-8 -t utf-8 -c file.txt > new-file.txt

然后检查新文件的结尾:

tail new-file.txt

检查顶部:

head new-file.txt

关于ubuntu - 从文件中删除所有非 utf-8 字符,终端中没有输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30312361/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com