gpt4 book ai didi

python - 使用 Python 访问 Hive 数据

转载 作者:太空狗 更新时间:2023-10-29 17:43:24 25 4
gpt4 key购买 nike

我在 HDFS 中有一些数据,我需要使用 python 访问这些数据,谁能告诉我如何使用 python 从 hive 访问数据?

最佳答案

要安装你需要这些库:

pip install sasl
pip install thrift
pip install thrift-sasl
pip install PyHive

如果您使用的是 Linux,则可能需要在运行上述命令之前单独安装 SASL。使用 apt-getyum 或任何包管理器安装包 libsasl2-dev。对于 Windows,有一些选项 on GNU.org .如果您安装了 xcode 开发人员工具 (xcode-select --install),在 Mac 上应该可以使用 SASL

安装后,您可以像这样执行配置单元查询:

from pyhive import hive
conn = hive.Connection(host="YOUR_HIVE_HOST", port=PORT, username="YOU")

现在您已经有了 Hive 连接,您可以选择如何使用它。您可以直接查询:

cursor = conn.cursor()
cursor.execute("SELECT cool_stuff FROM hive_table")
for result in cursor.fetchall():
use_result(result)

...或使用连接制作 Pandas 数据框:

import pandas as pd
df = pd.read_sql("SELECT cool_stuff FROM hive_table", conn)

关于python - 使用 Python 访问 Hive 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17722372/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com