python - 如何指定分配给 hive 中查询的最大 vcores？-6ren

python - 如何指定分配给 hive 中查询的最大 vcores？

转载作者：行者123 更新时间：2023-12-02 06:39:41

30

4

我正在配置单元上运行多个查询。我有一个 6 个节点的 Hadoop 集群。集群中的 vcore 总数为 21。

我只需要将 2 个核心分配给 python 进程，以便其余可用核心将由另一个主进程使用。

代码

from pyhive import hive
hive_host_name = "subdomain.domain.com"
hive_port = 20000
hive_user = "user"
hive_password = "password"
hive_database = "database"

conn = hive.Connection(host=hive_host_name, port=hive_port,username=hive_user, database=hive_database, configuration={})
cursor = conn.cursor()
cursor.execute('select count(distinct field) from somedata')

最佳答案

尝试在配置映射中传递以下设置:

yarn.nodemanager.resource.cpu-vcores=2

此设置的默认值为 8。

描述:可以为容器分配的CPU核心数。

您更新后的代码将类似于:

from pyhive import hive
hive_host_name = "subdomain.domain.com"
hive_port = 20000
hive_user = "user"
hive_password = "password"
hive_database = "database"
configuration = {
    "yarn.nodemanager.resource.cpu-vcores": 2
}

conn = hive.Connection( \
                       host=hive_host_name,
                       port=hive_port,
                       username=hive_user,
                       database=hive_database,
                       configuration=configuration
                      )
cursor = conn.cursor()
cursor.execute('select count(distinct field) from somedata')

Reference URL

关于python - 如何指定分配给 hive 中查询的最大 vcores？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58831467/

30

4

0

文章推荐： arrays - Perl 通过 Push in 子例程修改引用数组

文章推荐： jekyll - 无法使用 Jekyll 生成任何内容

文章推荐： Django 社交身份验证、linkedin 额外值

文章推荐： python - 移动文件并重命名(如果文件夹中存在)

azure - 如何处理Azure Synapse "Try reducing the numbers of vcores requested or increasing your vcore quota"
当我尝试在 Azure 中运行简单的 pyspark 脚本时，遇到了以下问题: %%pysparkdf = Spark.read.load('abfss://[email protected]/use
containers - "yarn.scheduler.minimum-allocation-vcores"和 yarn.scheduler.maximum-allocation-vcores"在决定容器/节点数量方面的作用？
我实际上是想弄清楚单个节点管理器中有多少个容器。它取决于哪些因素？ “yarn.scheduler.minimum-allocation-vcores”和“yarn.scheduler.maximum
sql-server - 弹性池的 VCore 扩展(例如从 2 到 4)与使用 VCore 创建新池 (4) 和移动数据库的延迟
我们有一种为 sql 弹性池实现的负载均衡器。基本上，它会合并两个池，或拆分两个池，或根据一些引用设置(计算、存储等)和我们从 SQL Server 获得的统计信息扩展存储。在某些情况下，作为将池拆分
hadoop - Yarn 在一个节点上分配了太多的 vcores
我在 yarn-site.xml 中将我的最大分配 vcores 设置为 1，并将物理核心数设置为 2。所有节点都相同。然而，有时，YARN 会为一个节点分配 3 个容器。它报告该节点上有 -1 个
scala - Yarn 集群不能平等地管理 vcore，超出队列资源限制
我有 3 个 yarn 节点管理器在 yarn 集群中工作，并且存在与每个 yarn 节点的 vcores 可用性相关的问题。例如，我有: 在第一个节点上:可用 15 个 vcores，在第二个节
python - 如何指定分配给 hive 中查询的最大 vcores？
我正在配置单元上运行多个查询。我有一个 6 个节点的 Hadoop 集群。集群中的 vcore 总数为 21。我只需要将 2 个核心分配给 python 进程，以便其余可用核心将由另一个主进程使用。
hadoop - hadoop作业日志中的 "vcore-seconds"是什么意思？
Job Counters Launched map tasks=3 Launched reduce tasks=45 Data-local map tasks=1 Ra
java - YARN 上可用的物理内核数和 VCores 之间的关系？
我是 yarn 的新手，我正在用 Java 编写一个 YARN 应用程序。根据要求，我只能在一台机器上使用 N 个物理内核。 YARN 允许设置我想分配给我的应用程序的 VCore 数和内存。是否可以
hadoop - MapReduce2 中如何基于 vcores 和内存创建容器？
我有一个由 1 个主节点(namenode、secondarynamenode、resourcemanager)和 2 个从节点(datanode、nodemanager)组成的小型集群。我已经在m
apache-spark - 如何配置 Yarn 以使用所有 vcores？
我们正在运行一个使用 yarn 作为集群管理器的 spark streaming 作业，我为每个节点分配了 7 个核心......通过 yarn-site.xml 如下图所示当作业运行时..它只使用
hadoop - 如何增加 AM 可以在 Hadoop 中使用的最大 vCores？
我正在努力处理一些 hadoop 配置。我正在寻求增加 Applications Master 可以使用的最大 vCore 数量。我的问题是目前只能使用 1 个 vCore(见下图)，因此我一次只能
apache-spark - Spark on YARN 使用的 vcore 太少
我在 YARN 集群 (HDP 2.4) 中使用 Spark，设置如下: 1 个主节点 64 GB RAM(50 GB 可用) 24 核(19 核可用) 5个从节点每个 64 GB RAM(50 G
azure - 将数据库定价从 DTU 更改为 vCore 后，应用服务备份失败
我有多个应用服务在同一应用服务计划下运行，并分别访问同一 SQL 弹性池中的一个 SQL 数据库。所有应用程序都配置为执行每日备份，包括数据库。在我将 SQL 弹性池的定价计划从 DTU(标准)更
获取 YARN 运行应用程序使用的容器和 vcore 数量的 Python 命令
1.问题基于这个问答:YARN shell command to get number of containers and vcores used by running applications 我
apache-spark - 使用的 YARN vCores : Spark on YARN
我正在使用以下配置在 YARN 上提交 spark 应用程序 conf.set("spark.executor.cores", "3") conf.set("spark.executor.memory
java - Hadoop - 资源是
我正在尝试在 AWS 上设置的集群上运行 wordcount 示例。它挂起，只是说正在运行作业。我在资源管理器日志中发现了这个错误我可以通过 HDFS UI (namenode:50070) 查看
hadoop - yarn : How to make Yarn utilize more memory and vcores
我们有一个由 Yarn 管理并运行 hadoop 的 5 节点集群 1 Master name node 8 vcores and 24GB memory 4 个数据节点，每个节点 8 个 vcore
hadoop - 用于获取正在运行的应用程序使用的容器和 vcore 数量的 YARN shell 命令
hadoop job -list 似乎只显示 mapreduce 作业，但我的资源管理器 UI 为在 YARN 上运行的所有作业显示诸如“分配的 CPU VCores”和“分配的内存 MB”之类的东西
hadoop - 如何在 hadoop mapreduce/yarn 中设置 VCORES？
以下是我的配置: **mapred-site.xml** map-mb : 4096 opts:-Xmx3072m reduce-mb : 8192 opts:-Xmx6144m **yarn-sit
azure - 如何在 Azure SQL 数据库中从 DTU 迁移到 vCore
目前，我们的 Azure 资源有 3 个(开发、质量保证和生产)阶段。这三个都使用 SQL 数据库“标准 S6:400 DTU”。由于 SQL 数据库的开发和 QA，我们每月的成本超过 700 欧元。

首页

博学

6Ren·AI

商城

python - 如何指定分配给 hive 中查询的最大 vcores？