- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
假设我创建了一个带有两列的 pandas DataFrame,b
(一个 DateTime)和 c
(一个整数)。现在我想从第一列 (b
) 中的值创建一个 DatetimeIndex:
import pandas as pd
import datetime as dt
a=[1371215423523845, 1371215500149460, 1371215500273673, 1371215500296504, 1371215515568529, 1371215531603530, 1371215576463339, 1371215579939113, 1371215731215054, 1371215756231343, 1371215756417484, 1371215756519690, 1371215756551645, 1371215756578979, 1371215770164647, 1371215820891387, 1371215821305584, 1371215824925723, 1371215878061146, 1371215878173401, 1371215890324572, 1371215898024253, 1371215926634930, 1371215933513122, 1371216018210826, 1371216080844727, 1371216080930036, 1371216098471787, 1371216111858392, 1371216326271516, 1371216326357836, 1371216445401635, 1371216445401635, 1371216481057049, 1371216496791894, 1371216514691786, 1371216540337354, 1371216592180666, 1371216592339578, 1371216605823474, 1371216610332627, 1371216623042903, 1371216624749566, 1371216630631179, 1371216654267672, 1371216714011662, 1371216783761738, 1371216783858402, 1371216783858402, 1371216783899118, 1371216976339169, 1371216976589850, 1371217028278777, 1371217028560770, 1371217170996479, 1371217176184425, 1371217176318245, 1371217190349372, 1371217190394753, 1371217272797618, 1371217340235667, 1371217340358197, 1371217340433146, 1371217340463797, 1371217340490876, 1371217363797722, 1371217363797722, 1371217363890678, 1371217363922929, 1371217523548405, 1371217523548405, 1371217551181926, 1371217551181926, 1371217551262975, 1371217652579855, 1371218091071955, 1371218295006690, 1371218370005139, 1371218370133637, 1371218370133637, 1371218370158096, 1371218370262823, 1371218414896836, 1371218415013417, 1371218415050485, 1371218415050485, 1371218504396524, 1371218504396524, 1371218504481537, 1371218504517462, 1371218586980079, 1371218719953887, 1371218720621245, 1371218738776732, 1371218937926310, 1371218954785466, 1371218985347070, 1371218985421615, 1371219039790991, 1371219171650043]
b=[dt.datetime.fromtimestamp(t/1000000.) for t in a]
c = {'b':b, 'c':a[:]}
df = pd.DataFrame(c)
df.set_index(pd.DatetimeIndex(df['b']))
print df
一切似乎都很好,除了当我打印 DataFrame 时,它说它有一个 Int64Index。
<class 'pandas.core.frame.DataFrame'>
Int64Index: 100 entries, 0 to 99
Data columns (total 2 columns):
b 100 non-null values
c 100 non-null values
dtypes: datetime64[ns](1), int64(1)
是我做错了什么还是我没有正确理解 Indeces 的概念?
最佳答案
set_index
不是就地(除非您传递 inplace=True
)。否则都是正确的
In [7]: df = df.set_index(pd.DatetimeIndex(df['b']))
In [8]: df
Out[8]:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 100 entries, 2013-06-14 09:10:23.523845 to 2013-06-14 10:12:51.650043
Data columns (total 2 columns):
b 100 non-null values
c 100 non-null values
dtypes: datetime64[ns](1), int64(1)
也作为仅供引用,在即将发布的 0.12 版本(下周)中,您可以通过 unit=us
指定自纪元以来的微秒单位
In [13]: pd.to_datetime(a,unit='us')
Out[13]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2013-06-14 13:10:23.523845, ..., 2013-06-14 14:12:51.650043]
Length: 100, Freq: None, Timezone: None
关于python - Pandas set_index 不设置索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17328655/
设置: np.random.seed(0) iix = pd.MultiIndex.from_product([['bar', 'baz', 'foo'],['one', 'two']]) df =
我有一个这样开头的 CSV 文件: Year,Boys,Girls 1996,333490,315995 1997,329577,313518 1998,325903,309998 当我将它读入 pa
我在 Julia 数据帧的 python 中寻找类似 .set_index() 的函数。 我搜索并发现 NamedArray 可以给出与 Python 中的 .set_index() 类似的结果,如下
我正在尝试从我的数据框中的列之一设置数据框的索引。这个数据框的旧索引本质上是没有意义的。 但是当我使用 set_index(['Name']) 时,我添加了一个新列,这不是我想要的行为。我找不到解决方
我有一个数据帧数据。分组并重置索引后,我无法将日期列设置为索引。 data = data.groupby('Payment Date ') data['Payment Amount '].sum().
我有一个从 HDFS 上的 parquet 文件创建的 dask 数据框。使用 api: set_index 创 build 置索引时,它失败并出现以下错误。 File "/ebs/d1/agent/
我找不到在 Pandas 0.14 中查找多重索引的方法。这是我遇到问题的一些模拟数据。 代码: row1 = ['red', 'ferrari', 'mine'] row2 = ['blue', '
我有一个看起来像这样的数据框(索引未显示) Time Letter Type Value 0 A x 10 0 B y
从上面,你可以看到我已经将索引设置为“index”。我的期望是能够使用“索引”列来删除行,并且仅使用“Barangay”列作为功能而不是数据框的索引。 如上所示,仍然使用“Barangay”列作为引用
我想用 df.set_index() 函数更改我的 DataFrame 索引列。虽然这提供了一个功能解决方案,但它创建了一个我想摆脱的“额外”行。 df = pd.DataFrame({'A': ['
我有很多大约这种类型的 DataFrame: import pandas as pd import numpy as np x1 = pd.DataFrame(np.vstack((np.random
我有一个如下所示的数据框: Priority RID_solve Prob RID_prob Remarks 0 1 5001 34
我有以下数据框: df = pd.DataFrame({ 'Trader': 'Carl Mark Carl Joe Joe Carl Joe Carl'.split(), 'Product': li
我在我的数据框上运行以下代码函数: del dfname["Unnamed: 0"] dfname["date"] = pd.to_datetime(dfname["date"]) dfname.se
在 Pandas 中,如果我有一个如下所示的 DataFrame: 0 1 2 3 4 5 6 0
我有一个数据框,正在尝试将索引设置为“时间戳”列。目前索引只是一个行号。时间戳格式的一个例子是:2015-09-03 16:35:00 我试过设置索引: df.set_index('Timestamp
假设我创建了一个带有两列的 pandas DataFrame,b(一个 DateTime)和 c(一个整数)。现在我想从第一列 (b) 中的值创建一个 DatetimeIndex: import pa
我有一个看起来像 like this 的数据框: 我想将 'TIME_STAMP_NEW' 列作为索引。当前代码: twoweektable['TIME_STAMP_NEW'] = pd.to_dat
data = [['g1','a',1],['g1','b',2],['g2','b',3],['g2','a',4]] df = pandas.DataFrame(data=data, column
我正在尝试调用 df.set_index,使我设置索引的列的 dtype 是新的 index.dtype。不幸的是,在下面的示例中,set_index 更改了 dtype。 df = pd.DataF
我是一名优秀的程序员,十分优秀!