gpt4 book ai didi

python-3.x - 为什么索引名称总是出现在用pandas 创建的parquet 文件中?

转载 作者:行者123 更新时间:2023-12-02 02:51:54 26 4
gpt4 key购买 nike

我正在尝试使用 Pandas 数据框创建 Parquet ,即使我删除了文件的索引,当我重新读取 Parquet 文件时它仍然出现。谁能帮我这个?我希望将 index.name 设置为 .

>>> df = pd.DataFrame({'key': 1}, index=[0])
>>> df
key
0 1
>>> df.to_parquet('test.parquet')
>>> df = pd.read_parquet('test.parquet')
>>> df
key
index
0 1
>>> del df.index.name
>>> df
key
0 1
>>> df.to_parquet('test.parquet')
>>> df = pd.read_parquet('test.parquet')
>>> df
key
index
0 1

最佳答案

它使用pyarrow按预期工作:

>>> df = pd.DataFrame({'key': 1}, index=[0])
>>> df.to_parquet('test.parquet', engine='fastparquet')
>>> df = pd.read_parquet('test.parquet')
>>> del df.index.name
>>> df
key
0 1
>>> df.to_parquet('test.parquet', engine='fastparquet')
>>> df = pd.read_parquet('test.parquet')
>>> df
key
index
0 1 ---> INDEX NAME APPEARS EVEN AFTER DELETING USING fastparquet
>>> del df.index.name
>>> df.to_parquet('test.parquet', engine='pyarrow')
>>> df = pd.read_parquet('test.parquet')
>>> df
key
0 1 --> INDEX NAME IS NONE WHEN CONVERSION IS DONE WITH pyarrow

关于python-3.x - 为什么索引名称总是出现在用pandas 创建的parquet 文件中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51872543/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com