gpt4 book ai didi

regex - 从文件中删除包含非英语 (Ascii) 字符的行

转载 作者:行者123 更新时间:2023-12-03 23:12:41 24 4
gpt4 key购买 nike

我有一个文本文件,其中包含来自不同语言的字符,例如(中文、拉丁文等)

我想删除所有包含这些非英文字符的行。我想包括所有英文字符 (a-b)、数字 (0-9) 和所有标点符号。

我如何使用 awk 或 sed 等 unix 工具来做到这一点。

最佳答案

Perl 支持 [:ascii:]字符类。

perl -nle 'print if m{^[[:ascii:]]+$}' inputfile

关于regex - 从文件中删除包含非英语 (Ascii) 字符的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11577720/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com