python-3.x - 解压 'SNAPPY' 不适用于 fastparquet-6ren

python-3.x - 解压 'SNAPPY' 不适用于 fastparquet

转载作者：行者123 更新时间：2023-12-03 22:26:16

27

4

我正在尝试使用 fastparquet 打开文件，但出现错误:

RuntimeError: Decompression 'SNAPPY' not available.  Options: ['GZIP', 'UNCOMPRESSED']

我安装了以下内容并重新启动了我的解释器:

python                    3.6.5                hc3d631a_2  
python-snappy             0.5.2                    py36_0    conda-forge
snappy                    1.1.7                hbae5bb6_3  
fastparquet               0.1.5                    py36_0    conda-forge

一切顺利下载。我不知道我是需要 snappy 还是 python-snappy，所以我得到了一个没有修复的问题，得到了另一个，但仍然没有成功。下载 snappy 时，我发现的所有相关问题都已解决，但我仍然收到两个 snappy 的错误!任何帮助，将不胜感激。

最佳答案

跑:

pip install python-snappy
pip install pyarrow

它应该可以解决问题。

我觉得你缺少 pyarrow包裹。

如果您遇到 pip 的错误, 使用 conda相反(即 conda install python-snappy 或者如果您仍然有错误 conda install -c conda-forge python-snappy )。

关于python-3.x - 解压 'SNAPPY' 不适用于 fastparquet，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50800748/

27

4

0

文章推荐： ms-office - 如何在 Excel 功能区中制作清晰的图标？

文章推荐： jquery - 在 Phonegap 项目中使用普通 JQuery(使用 JQuery Mobile)

文章推荐： jquery - 如何使用 jQuery 在单击按钮时显示表格的另外 5 行

文章推荐：从Spring @RestController收到的AngularJS显示PDF(字节[])

python - Fastparquet 似乎并没有推倒过滤器
我使用 dask 的 dataframe to_parquet 方法创建了一个 parquet 文件，并使用 fastparquet 作为引擎。使用 fastparquet.ParquetFile 读
python - dask 分布式 fastparquet 中的处理时间不一致
我有一个配置单元格式和快速压缩的 Parquet 文件。它适合内存，并且 pandas.info 提供以下数据。 parquet 文件中每组的行数仅为 100K >>> df.info() Inde
python - fastparquet 和 pyarrow 之间的比较？
经过一番搜索后，我未能找到 fastparquet 和 pyarrow 的彻底比较。我找到了这个博客 post (速度的基本比较)。和一个 github discussion声称使用 fastpa
python - python fastparquet 模块可以读取压缩的 Parquet 文件吗？
我们的 parquet 文件存储在 aws S3 存储桶中，并由 SNAPPY 压缩。我能够使用 python fastparquet 模块读取未压缩版本的 Parquet 文件，但不能读取压缩版本。
python-3.x - 解压 'SNAPPY' 不适用于 fastparquet
我正在尝试使用 fastparquet 打开文件，但出现错误: RuntimeError: Decompression 'SNAPPY' not available. Options: ['GZIP
dask - 如何使用 dask/fastparquet 从多个目录读取多个 Parquet 文件(具有相同的架构)
我需要使用 dask 将具有相同架构的多个 Parquet 文件加载到单个数据框中。这在它们都在同一目录中时有效，但当它们在不同的目录中时无效。例如: import fastparquet pfil
python - 在 python 中导入 fastparquet 时 snappy 出错
我在已经安装了 python (3.6) 和 anaconda 的 EC2 服务器中安装了以下模块: 活泼的 pyarrow s3fs 快速拼花除了 fastparquet 其他一切都适用于导入。当
Python Pandas 使用 Fastparquet 将 CSV 转换为 Parquet
我在 PyCharm venv 中使用 Python 3.6 解释器，并尝试将 CSV 转换为 Parquet。 import pandas as pd df = pd.read_csv('/p
python - pyarrow 可以将多个 Parquet 文件写入 fastparquet 的 file_scheme ='hive' 选项之类的文件夹吗？
我有一个数百万条记录的 SQL 表，我打算使用 pyarrow 库将其写入文件夹中的许多 Parquet 文件。数据内容似乎太大，无法存储在单个 parquet 文件中。但是，我似乎无法在 pyar
python - Fastparquet 在使用 dataframe.to_parquet() 时给出 "TypeError: expected str, bytes or os.PathLike object, not _io.BytesIO"
我正在尝试为 AWS Lambda 创建代码以将 csv 转换为 parquet。我可以使用 Pyarrow 做到这一点，但它的大小太大(约 200 MB 未压缩)，因此我无法在 Lambda 的部署

首页

博学

6Ren·AI

商城

python-3.x - 解压 'SNAPPY' 不适用于 fastparquet