- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
出于某种原因,以下 2 次调用 iloc
/loc
会产生不同的行为:
>>> import pandas as pd
>>> df = pd.DataFrame(dict(A=range(3), B=range(3)))
>>> df.iloc[:1]
A B
0 0 0
>>> df.loc[:1]
A B
0 0 0
1 1 1
我知道 loc
考虑行标签,而 iloc
考虑行的基于整数的索引。但为什么 loc
调用的上限被认为是包容性的,而 iloc
的上限被认为是排他性的?
最佳答案
快速回答:
在使用标签时进行端包含切片通常更有意义,因为它需要较少的有关 DataFrame 中其他行的知识。
每当您关心标签而不是位置时,端排他标签切片会以一种可能不方便的方式引入位置依赖性。
更长的答案:
任何函数的行为都是一种权衡:您偏爱某些用例而不是其他用例。最终运行.iloc
是 Pandas 开发人员的主观设计决定(如@ALLollz 的评论所示,此行为 is intentional )。但要理解他们为什么会那样设计,请思考是什么让标签切片不同于位置切片。
假设我们有两个 DataFrame df1
和 df2
:
df1 = pd.DataFrame(dict(X=range(4)), index=['a','b','c','d'])
df2 = pd.DataFrame(dict(X=range(3)), index=['b','c','z'])
df1
包含:
X
a 0
b 1
c 2
d 3
df2
包含:
X
b 0
c 1
z 2
假设我们要执行一个基于标签的任务:我们想要获取 b
之间的行和 c
来自 df1
和 df2
,我们希望对两个 DataFrame 使用相同的代码。因为b
和 c
在两个 DataFrame 中没有相同的位置,简单的位置切片不会解决问题。所以我们转向基于标签的切片。
如果.loc
是最终独占的,以获取 b
之间的行和 c
我们不仅需要知道所需结束行的标签,还需要知道该行之后的下一行的标签。按照构造,下一个标签在每个 DataFrame 中都是不同的。
在这种情况下,我们有两个选择:
df1.loc['b':'d']
和 df2.loc['b':'z']
.这很不方便,因为这意味着我们需要了解我们想要的行之外的额外信息。df.iloc[df.index.get_loc('b'):df.index.get_loc('c')+1]
.这只是罗嗦。但是自.loc
是 end-inclusive,我们可以说 .loc['b':'c']
.简单多了!
每当您关心标签而不是位置,并且您正在尝试编写与位置无关的代码时,包含端点的标签切片会以一种可能不方便的方式重新引入位置相关性。
也就是说,也许在某些用例中您确实需要最终独占的基于标签的切片。如果是这样,您可以使用 @Willz's answer in this question :
df.loc[start:end].iloc[:-1]
关于python - 为什么 .loc 对切片具有包容性行为?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49962417/
简而言之: 我怎样才能切片?也就是说,能够指定我想从多个索引(例如 y = x[(2, 5, 11)] )中提取,而不仅仅是单个索引(例如 y = x[2] )。 简单示例 : 说我有这个数据: d
是否可以在 F# 中对 Array2D 进行切片? 说,let tmp =Array2D.init 100 100 (fun x y -> x * 100 + y) 如何从 tmp 中检索某些列或某些
例如,我希望文本仅显示“此处”,但它不起作用。文本经常变化,但我需要的单词保持在固定位置。我想访问该词。 我做错了什么? function myFunction() { var x = doc
当尝试使用spring的分页或切片来迭代非常大的mongodb集合时,程序运行正常,但在某些时候下一页/切片为空,并且在调试时出现“包含未知实例的页面/切片”消息. 这是代码示例: do { Pa
有人能给我一个关于如何分割 ListView 的例子吗?我正在使用 SimpleCursorAdapter 在 ListView 中显示数据.. 我的代码是这样的。 private WordDbAda
这个问题在这里已经有了答案: C++ slicing causing leak / undefined behavior / crash (3 个答案) 关闭 8 年前。 如果我有如下代码: cla
这个问题在这里已经有了答案: Understanding slicing (38 个答案) 关闭 5 年前。 我目前有 500 行数据。我想使用前五十行,然后跳过 50 行,依此类推。我该如何继续这
为什么对一行或一列进行切片会产生“无量纲数组”?例如: import numpy as np arr = np.zeros((10,10)) print arr.shape # (10, 10) 但是
我有以下 pandas 数据框: Shortcut_Dimension_4_Code Stage_Code 10225003 2 8225003
如何通过数组为 ruby 中的散列创建切片,如下所示: info = { :key1 => "Lorem", :key2 => "something...", :key3 => "
这个问题在这里已经有了答案: regex to get all text outside of brackets (4 个答案) 关闭 5 年前。 我正在编写的这个程序接收到一个大小不同的字符串,其
我尝试使用 tf.Tensor.getitem 对张量进行切片功能如下: indices = [0, 5] data[:,:,indices] 但是我得到以下错误: TypeError: can on
这个问题在这里已经有了答案: Can I create a "view" on a Python list? (10 个答案) 关闭 7 年前。 有没有一种方法可以在 Python 3 中创建序列的
我想弄清楚如何从多维数组中获取单个维度(为了论证,假设它是二维的),我有一个多维数组: double[,] d = new double[,] { { 1, 2, 3, 4, 5 }, { 5, 4,
我有一个 std::vector。我想创建代表该 vector 切片的迭代器。我该怎么做?在伪 C++ 中: class InterestingType; void doSomething(slice
写在前面 前面的文章介绍了Go的一些基本类型,本文开始涉及Go的一些容器类型,它们都是可以包含多个元素的数据结构,如数组、切片、map 数组 数组是具有相同类型且长度固定的一组元素集合,定义的格式:v
给定一个 numpy 数组和一个 __getitem__ 类型的索引,是否有一种惯用的方法来获取数组的相应切片,总是返回一个数组而不是标量? 有效索引的示例包括:int、slice、省略号或上述的元组
我创建了一个继承自 pandas.DataFrame 的类。在此类中添加了元数据(不是添加到列中,而是添加到类实例中): class MeasurementPoint(pandas.DataFrame
我想在空间上剪切视频以生成 N x M 个文件。 例如,我想把 test.video 拆分成 NxM 的瓦片? Video tiles 最佳答案 您可以使用 ffmpeg 及其 crop filter
这是一个示例代码。比如我想拉德国 在页面加载时切片。在这段代码中,它拉取第一个切片。 无功图; var 传说; var chartData = [{ 国家:“立陶宛”, 值:260}, { 国家:“爱
我是一名优秀的程序员,十分优秀!