- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在 Pandas 数据框中,可以使用 reset_index()
方法重置索引。一个可选参数是 drop=True
,根据文档:
drop : bool, default False
Do not try to insert index into dataframe columns.
This resets the index to the default integer index.
我的问题是,第一句话是什么意思?如果我离开 if False,它会尝试将整数索引转换为我的 df 中的新列吗?
此外,我的行顺序会被保留还是我还应该进行排序以确保正确的顺序?
最佳答案
如下所示,df.reset_index()
会将索引作为列移动到数据帧中。如果索引只是一个通用的数字索引,您可能不关心它并且可以丢弃它。下面是一个简单的数据框,但我删除了第一行只是为了在索引中具有不同的值。
df = pd.DataFrame([['a', 10], ['b', 20], ['c', 30], ['d', 40]], columns=['letter','number'])
df = df[df.number > 10]
print(df)
# letter number
# 1 b 20
# 2 c 30
# 3 d 40
默认行为现在显示名为 index
的列,它是以前的索引。您可以看到 df['index']
与上面的索引匹配,但索引已从 0 开始重新编号。
print(df.reset_index())
# index letter number
# 0 1 b 20
# 1 2 c 30
# 2 3 d 40
drop=True
不会假装索引很重要,只是为您提供一个新索引。
print(df.reset_index(drop=True))
# letter number
# 0 b 20
# 1 c 30
# 2 d 40
关于行顺序,我怀疑它会被保留,但通常不应该依赖存储内容的顺序。如果您正在执行聚合函数,您可能需要确保为聚合正确排序了数据。
关于python - 关于 pd.dataframe.reset_index() 中 drop=True 的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55746957/
接听时this question ,当我尝试根据数据帧索引上完成的基本计算创建列时,我遇到了我认为意外的行为。 我并不是真正在寻找解决方案,而是试图找出为什么发生这种情况。我可能忽略了一些基本的东西.
我有一个 pandas DataFrame,有 2 个分组列和 3 个数字列。我将数据分组如下: df = df.groupby(['date_week', 'uniqeid']).agg({
示例数据框: import numpy as np df = pd.DataFrame(np.random.randint(0, 10, size=(10, 4)), columns=list('AB
有没有reset_index相当于列标题?换句话说,如果列名是 MultiIndex ,我将如何降低其中一个级别? 最佳答案 回答第二个问题: df.columns = df.columns.drop
我需要使用iloc和reset_index编辑给定的数据集。但问题是我有900个这样的数据集,我想使用一些函数来循环并获取输出。但是当我定义一个函数时iloc 和 Reset_index 未执行...
当替代方案更快时,为什么我要使用 reset_index(drop=True)?我确定我缺少某些东西。 (或者我的时机不太好......) import pandas as pd l = pd.Ser
阅读本文时 article ,我遇到了这个说法。 order_total = df.groupby('order')["ext price"].sum().rename("Order_Total").
是否有任何等效于 pandas.DataFrame.reset_index() 的操作,可以处理列名重复的情况?我希望它丢弃列名并为列返回默认编号索引 0,1,2..。 (当我有重复的列名时,df.r
有人可以解释在对数据帧执行 groupby(...).size() 操作之后的 reset_index(name='counts') 操作期间发生了什么吗?它完全符合我的要求(创建一个数据框,其中有一
我在读一篇 CSV文件消除重复项并导出到数据库。 这里的问题是它正在创建一个名为 level0 的列。而不是重置索引。 这是我的代码 df = pd.read_csv('SampleData.csv'
我生成了一个分组数据框 df = df.groupby(['X','Y']).max() 然后我想将其写入(到 csv,没有索引)。所以我需要将“X”和“Y”转换回常规列;我尝试使用 reset_in
这里有一个非常奇怪的错误:我正在使用 pandas 来合并几个数据框。作为合并的一部分,我必须多次调用 reset_index。但是当我这样做时,它会在第二次或第三次使用 reset_index 时意
我正在尝试按列分组并计算另一列的值计数。 import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2],
我正在尝试展平 Pandas Dataframe MultiIndex,以便只有一个级别的索引。基于任意数量的 SE 帖子的通常解决方案是使用 df.reset_index 命令,但这并不能解决问题。
我有一个如下所示的 Pandas DataFrame: a b c d 0 Apple 3 5 7 1 Banana 4 4
我有一个名为 data_match 的 Pandas 数据框。它包含“_worker_id”、“_unit_id”和“caption”列。 (有关此数据框中的某些行,请参阅随附的屏幕截图) 假设索引列
在 Pandas 数据框中,可以使用 reset_index() 方法重置索引。一个可选参数是 drop=True ,根据文档: drop : bool, default False Do n
当在 Python Pandas 中对数据帧进行切片时,它会记住行的索引。如果你不想要这个,你可以使用 df.reset_index(drop=true)。但是有没有办法可以将其设置为默认值?我总是想
这是我的数据格式,我想重置索引并希望将其设为一种表格格式,这样我就可以计算第二行的所有 id 的计数,并可以按日期和计数用直方图绘制它们, 有什么简单的想法吗? 最佳答案 如果reset_index(
我只是想知道这两个执行的功能有什么区别。 数据: import pandas as pd df = pd.DataFrame({"ID":["A","B","A","C","A","A","C","B
我是一名优秀的程序员,十分优秀!