gpt4 book ai didi

python-3.x - 从 Multiindex 中获取 key ?

转载 作者:行者123 更新时间:2023-12-05 03:11:13 25 4
gpt4 key购买 nike

我有一个带有 ID 和日期的 MultiIndex,格式如下:

MultiIndex(levels=[[196003, 196005, 196007, 196009, 196012, 196103, 196105, 196107, 196109, 196112, 196203, 196205, 196207, 196209, 196212, 196303, 196305, 196307, 196309, 196312, 196403, 196405, 196407, 196409, 196412, 201705, 201707, 201709, 201712, 201803, 201805, 201807, 201809, 201812], ['1959-07-01', '1959-07-02', '1959-07-06', '1959-07-07', '1959-07-08', '1959-07-09', '1959-07-10', '1959-07-13', '1959-07-14', '1959-07-15', '1959-07-16', '1959-07-17', '1959-07-20', '1959-07-21', '1959-07-22', '1959-07-23', ...]])

ID 和日期都需要唯一地指定一行。

我想做的是提取索引的第一层。

当我执行 df.index[0] 时,我得到一个 (196003, '1959-07-01') 形式的元组

我想要的是 [196003, 196005, ...] 形式的一系列 key ,用于级别 0。

我设法得到它:

list(df[~df['ID'].duplicated()]['ID'].sort_values().reset_index()['ID'])

但我认为这是一个困惑且缓慢的解决方案。

pandas 的方式是什么?

最佳答案

我想你可以使用 get_level_valuesunique :

import pandas as pd

df = pd.DataFrame({'ID':[1,1,3],
'Dates':['2015-01-01','2015-01-01','2015-02-01'],
'C':[7,8,9]})
df['Dates'] = pd.to_datetime(df.Dates)
df.set_index(['ID', 'Dates'], inplace=True)
print (df)
C
ID Dates
1 2015-01-01 7
2015-01-01 8
3 2015-02-01 9

print (df.index.get_level_values('ID').unique().tolist())
[1, 3]

#another a bit slowier solution
print (df.index.get_level_values('ID').drop_duplicates().tolist())
[1, 3]

时间:

In [134]: %timeit (orig(df1))
1000 loops, best of 3: 1.54 ms per loop

In [138]: %timeit (df.index.get_level_values('ID').unique().tolist())
10000 loops, best of 3: 131 µs per loop

In [139]: %timeit (df.index.get_level_values('ID').drop_duplicates().tolist())
10000 loops, best of 3: 182 µs per loop

计时代码:

len(df) = 3k:

import pandas as pd

df = pd.DataFrame({'ID':[1,1,3],
'Dates':['2015-01-01','2015-01-01','2015-02-01'],
'C':[7,8,9]})
df = pd.concat([df]*1000).reset_index(drop=True)
df['Dates'] = pd.to_datetime(df.Dates)
df.set_index(['ID', 'Dates'], inplace=True)
print (df)


df1 = df.copy()
df1.reset_index('ID', inplace=True)

def orig(df):

return list(df[~df['ID'].duplicated()]['ID'].sort_values().reset_index()['ID'])

print (df.index.get_level_values('ID').unique().tolist())

print (orig(df1))

print (df.index.get_level_values('ID').drop_duplicates().tolist())

关于python-3.x - 从 Multiindex 中获取 key ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37747524/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com