gpt4 book ai didi

linux - 如何在Linux中的Thorn字符 'þ'上分割一行?

转载 作者:太空宇宙 更新时间:2023-11-04 05:02:08 25 4
gpt4 key购买 nike

如何在 Linux 中以 Thorn 字符“þ”分割行?

我尝试过以下方法

awk -F 'þ' '{print $2}'
awk -F '\xC3\xBE\x02' '{print $2}'
awk -F 'þ' '{print $2}'

没有任何作用。

编辑:该文件位于 HDFS(Hadoop 文件系统)路径中,以下命令适用于命令行,但不适用于 shell 脚本(执行 shell 脚本时,它会给出空输出,即无法识别 thorn char!!

命令行:

~/etltestsar/DoubleClick$ hadoop fs -cat /raw/doubleclick/data/dt=2015-03-30/NetworkMatchtablesActivity_7657_03-30-2015_advertiser.log.gz|gunzip|tail -n +2|awk -F 'þ' '
Warning: $HADOOP_HOME is deprecated.

3848762
3963771
4112862
4140939
4199580
4199584
.....

shell 脚本中的相同命令不会产生输出

hadoop@node28-19-88:~/etltestsar/DoubleClick$ sh testthorn.sh
Warning: $HADOOP_HOME is deprecated.

最佳答案

获取不同的 awk? cygwin 上的 bash 4.1.17(9) 中的 GNU awk 4.1.1:

$ cat file
fooþbar

$ awk -F 'þ' '{print $2}' file
bar

关于linux - 如何在Linux中的Thorn字符 'þ'上分割一行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29710349/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com