gpt4 book ai didi

python - 如何更改 Pandas 数据框索引值?

转载 作者:太空狗 更新时间:2023-10-29 16:55:19 24 4
gpt4 key购买 nike

我有一个df:

>>> df
sales cash
STK_ID RPT_Date
000568 20120930 80.093 57.488
000596 20120930 32.585 26.177
000799 20120930 14.784 8.157

并希望将第一行的索引值从 ('000568','20120930') 更改为 ('000999','20121231')。最终结果将是:

>>> df
sales cash
STK_ID RPT_Date
000999 20121231 80.093 57.488
000596 20120930 32.585 26.177
000799 20120930 14.784 8.157

如何实现?

最佳答案

使用此设置:

import pandas as pd
import io

text = '''\
STK_ID RPT_Date sales cash
000568 20120930 80.093 57.488
000596 20120930 32.585 26.177
000799 20120930 14.784 8.157
'''

df = pd.read_csv(io.BytesIO(text), delimiter = ' ',
converters = {0:str})
df.set_index(['STK_ID','RPT_Date'], inplace = True)

索引 df.index 可以像这样重新分配给一个新的 MultiIndex:

index = df.index
names = index.names
index = [('000999','20121231')] + df.index.tolist()[1:]
df.index = pd.MultiIndex.from_tuples(index, names = names)
print(df)
# sales cash
# STK_ID RPT_Date
# 000999 20121231 80.093 57.488
# 000596 20120930 32.585 26.177
# 000799 20120930 14.784 8.157

或者,可以将索引做成列,然后重新分配列中的值,然后将列返回给索引:

df.reset_index(inplace = True)
df.ix[0, ['STK_ID', 'RPT_Date']] = ('000999','20121231')
df = df.set_index(['STK_ID','RPT_Date'])
print(df)

# sales cash
# STK_ID RPT_Date
# 000999 20121231 80.093 57.488
# 000596 20120930 32.585 26.177
# 000799 20120930 14.784 8.157

使用 IPython 进行基准测试 %timeit 建议重新分配索引(上面的第一种方法)比重置索引、修改列值然后再次设置索引(上面的第二种方法)要快得多):

In [2]: %timeit reassign_index(df)
10000 loops, best of 3: 158 us per loop

In [3]: %timeit reassign_columns(df)
1000 loops, best of 3: 843 us per loop

关于python - 如何更改 Pandas 数据框索引值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14110721/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com