gpt4 book ai didi

hadoop - 在直线中删除输出中的标题

转载 作者:可可西里 更新时间:2023-11-01 16:24:33 26 4
gpt4 key购买 nike

我正在尝试使用 beeline cli 来查询配置单元表并将输出结果存储为变量。使用直线命令:

beeline -u connection_string -n user_name -w password_file \
-e "select count(*) from db.table_name"

使用此命令,我得到当前输出结果为:

+---------------+--+ 
| record_count |
+---------------+--+
| 80785 |
+---------------+--+

虽然我需要的结果是:Record count:80785

我正在使用的另一个命令是:

beeline -u connection_string -n user_name -w password_file \
-e "select * from db.table_name;” > result.csv

再次以 | 分隔的表格格式数据显示结果。

默认情况下,基本上直线返回标题(table_name.column_name),然后是表格格式的数据。然而,我想消除它并获得像 hive CLI 这样的结果。

最佳答案

您可以使用参数 --showHeader=false --outputformat=tsv2 来阐明这一点。

使用这种格式你的命令会像

beeline --showHeader=false --outputformat=tsv2 \
-u connection_string -n user_name -w password_file \
-e "select count(*) from db.table_name"

考虑是否使用 tsv2

id  value   comment
1 Value1 Test comment 1
2 Value2 Test comment 2
3 Value3 Test comment 3

如果使用dsv(分隔符为|)

id|value|comment
1|Value1|Test comment 1
2|Value2|Test comment 2
3|Value3|Test comment 3

您的数据将如下所示。请记住,如果值中有特殊字符或换行符,则这三个在值周围使用单引号启用。可以通过将 disable.quoting.for.sv 设置为 true 来禁用引用。

使用 CSV 和 TSV 的更多选项

csv, tsv These two formats differ only with the delimiter between values, which is comma for csv and tab for tsv.

当使用 csv 时,数据将如下所示

'id','value','comment'
'1','Value1','Test comment 1'
'2','Value2','Test comment 2'
'3','Value3','Test comment 3'

而当使用tsv时,则

'id'    'value' 'comment'
'1' 'Value1' 'Test comment 1'
'2' 'Value2' 'Test comment 2'
'3' 'Value3' 'Test comment 3'

请注意 在使用csv 或tsv 时,单引号总是被值包围并且您无法摆脱它,这可能会导致一些问题少数情况。

希望上面的详细解释能够涵盖您想要涵盖的所有可能情况。

有关更多说明,请访问 Apache Beeline Wiki page .欢呼!!

关于hadoop - 在直线中删除输出中的标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47987097/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com