gpt4 book ai didi

hadoop - Jaspersoft iReport - 如何设置 Hive 查询的缩减器数量?

转载 作者:可可西里 更新时间:2023-11-01 14:55:10 26 4
gpt4 key购买 nike

我正在尝试使用 Jaspersoft iReport 使用 Hive 运行一些报告,它运行良好,除了我尝试为 Hive 查询设置缩减器数量的情况。我认为这个问题可能适用于使用 Hive JDBC 设置 reducer 数量的一般情况。

我该怎么做?

最佳答案

您不能将 2 个 SQL 语句(或 HiveQL 语句)放入报表查询中。这意味着您不能使用这样的查询字符串:

set mapred.running.reduce.limit = 25;
SELECT name, phone_office, billing_address_city, billing_address_street, billing_address_country FROM accounts;

通常我会考虑将这样的属性放入 JDBC 连接中。但据我所知,Hive 不支持这一点。但我认为您可以通过将“set”HiveQL 语句作为主要报告查询来解决这个问题。然后将“选择”查询作为子数据集。这是我测试这个想法的报告的片段:

<subDataset name="Accounts">
<queryString language="HiveQL">
<![CDATA[SELECT name, phone_office, billing_address_city, billing_address_street, billing_address_country FROM accounts]]>
</queryString>
<field name="name" class="java.lang.String"/>
<field name="phone_office" class="java.lang.String"/>
<field name="billing_address_city" class="java.lang.String"/>
<field name="billing_address_street" class="java.lang.String"/>
<field name="billing_address_country" class="java.lang.String"/>
</subDataset>
<queryString language="HiveQL">
<![CDATA[set mapred.running.reduce.limit = 25]]>
</queryString>

我确认报告是这样工作的。正如您所期望的那样,我的子数据集填充了一个表组件。我没有一个简单的方法来确认它确实限制了 reducer 的数量……但它应该。 (如果有,请告诉我们!)

关于hadoop - Jaspersoft iReport - 如何设置 Hive 查询的缩减器数量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9805465/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com