gpt4 book ai didi

linux - 在 linux 中连接文件中的行

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:08:41 25 4
gpt4 key购买 nike

我已经在下面发布了这个问题的答案......请找到它。如果可以,请随意对其进行优化 :)。

所以问题的简要描述:我创建了一个文件,其中包含来自 psql 查询的大量输出,我正在尝试使用此数据,但输出格式并不理想。以下是数据的分割:

some_date | some_username | some_port | statement:

: SELECT some_query

some_date | some_username | some_port | statement: SELECT some_different_query

这就是数据的样子,问题是粗线。我不知道为什么该语句会像这样分成两行,但它会影响我需要做的其余处理。如果只看粗体部分的字符,是这样的:

statement:>$

:> query$

其中 > 是空格,$ 是一个 eol 字符。

所以我真的需要将这两行连接在一起,但我不知道该怎么做。到目前为止,这是我尝试过的:

sed 's/\n://g' filename

这显然行不通。这也有道理,因为我相信 SED 是在逐行的基础上工作的。任何建议将不胜感激。

下面是数据的截图。我无法复制数据,因为我的 VM 不允许。对不起...

enter image description here

下面是我希望这些数据的样子...试试你的 awk :P:

enter image description here

最佳答案

sed 用于在单行上进行简单替换,仅此而已。对于任何稍微更有趣的事情,您都应该使用 awk 来获得清晰、简单、健壮、可移植性和软件的几乎所有其他理想属性。

鉴于我编写的这个示例输入文件:

$ cat file
some_date | some_username | some_port | statement:
: SELECT some_query
:lines and lines
:of stuff...
some_date | some_username | some_port | statement: SELECT some_different_query
some_date | some_username | some_port | statement:
: SELECT something else where
:the quick brown fox
: jumped over
: the lazy
:dog's back

这个 awk 命令可能是你想要的:

$ awk '{printf "%s%s", (NR==1 || sub(/^: */,OFS) ? "" : ORS), $0} END{print ""}' file
some_date | some_username | some_port | statement: SELECT some_query lines and lines of stuff...
some_date | some_username | some_port | statement: SELECT some_different_query
some_date | some_username | some_port | statement: SELECT something else where the quick brown fox jumped over the lazy dog's back

但我必须自己构建输入集来进行测试,因此它可能与您的实际输入并不完全匹配,而且您没有发布任何预期的输出,所以我只是猜测。

如果没有,请编辑您的问题以提供几行具体的、可测试的样本输入和预期输出。

如果您不熟悉 awk 和其他类似 C 的语言,这里是 awk 命令的含义:

awk '
{ # WHILE read the current line ($0) DO
printf "%s%s", # prepare to print 2 strings with no trailing newline
(NR==1 # IF this is the first line of input
|| sub(/^: */,OFS) # OR we can replace :<space>* with one space (OFS)
? # THEN
"" # the first string to print is NULL
: # ELSE
ORS # the first string to print is a newline (ORS)
) # ENDIF
, $0 # the second string to print is the current input line
} # ENDWHILE
END{print ""} # print a newline (ORS) at the end of the output
' file

注释为 IF..ENDIF 的部分只是一个常见的三元表达式,在许多语言中使用,OFS 和 ORS 是 awk 内置变量,包含输出字段分隔符和输出记录分隔符字符串(默认情况下是一个空格和一个分别换行)。

关于linux - 在 linux 中连接文件中的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32695360/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com