- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个 Pandas DataFrame,其中一列是出租车所覆盖的行程距离。我正在使用value_counts()
在此列上查看最常见的行程距离。b = df['trip_distance'].value_counts()
对象 b 是一个 Pandas 系列对象。为了完成起见,本系列的前 5 行是
1.00 21815
0.90 18915
0.80 18449
1.10 18263
1.20 17823
这意味着最常见的行程距离是 1,它出现了 21815 次,其余的都一样。
b[0:4]
它没有打印此系列的前 4 个元素,而是查找对应于
0
的元素。行程距离,并开始打印所有行程距离,直到达到行程距离 4。当然,如果行程距离 4 在行程距离 0 之前,则返回一个空系列。
a = pd.Series([3, 1, 2, 3, 4, 4, 5]).value_counts()
打印
a
给
4 2
3 2
5 1
2 1
1 1
当我尝试对这个系列进行切片时,即当我输入
a[0, 3]
时我得到了预期
4 2
3 2
5 1
有谁知道为什么会这样?
最佳答案
当索引来自系列(或来自数据帧的行)的值时,我将始终建议您使用 .loc
和 .iloc
索引访问器。本质上,通过使用这些访问器,您明确地告诉 Pandas loc
:“此切片将基于索引的顺序”或iloc
:“此切片将基于值的排序”。当您不使用 loc/iloc(例如您的案例)并且有数字索引时,棘手的部分就出现了。当您不使用它们时,pandas 会尝试推断您指的是索引顺序还是值的顺序。本质上,如果您使用一系列数字进行切片,pandas 会假设您正在尝试使用值的位置 - 忽略索引。
import pandas as pd
data = pd.Series([5,6,7,8,9], index=range(10, 15))
print(data)
10 5
11 6
12 7
13 8
14 9
dtype: int64
使用
.loc
从索引中获取对应于切片“a”到“c”的值:
# Slice based on the index values 11 to 13
data.loc[11:13]
11 6
12 7
13 8
dtype: int64
但是,如果我们想要基于它们在系列中的位置的值,我们使用
iloc
.您还会注意到
iloc
生成不包含最终值的切片(例如,我们只返回元素 1 和 2,并在下面的示例中省略 3)。而在上面使用 loc 的示例中,我们返回了对应于索引中 11、12 和 13 的元素。
data.iloc[1:3]
11 6
12 7
dtype: int64
既然已经说了,我希望你明白为什么这意味着什么非常不清楚:
data[11:13]
我们是否要求 Pandas 在索引中找到值 11 到 13 的位置并给我们那个切片?或者我们要求这个系列的第 12 和第 13 元素?在这种情况下,pandas 使用了后者(见下文)。但是,我鼓励您始终使用
loc
切片成系列或数据帧。或
.iloc
为了避免这种歧义。
data[11:13]
Series([], dtype: int64)
这仅用于对基于整数的索引进行切片。您的问题来自 Pandas 如何实现 float 类型索引(这是真正的头脑 Storm ):
data.index = data.index.astype("float")
print(data)
10.0 5
11.0 6
12.0 7
13.0 8
14.0 9
dtype: int64
现在突然之间,您可以执行此操作并返回值,就像您使用
.loc
一样。 :
data[11:13]
11.0 6
12.0 7
13.0 8
dtype: int64
那么什么给呢?本质上,必须做出决定。需要有某种类型的默认行为来切片成系列,不幸的是它取决于索引,这使得它在索引数据类型之间变得不稳定。幸运的是,您可以使用
loc
避免所有这些混淆。和
iloc
.
关于python - 与 Pandas 系列切片的混淆,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64325834/
我真的很困惑。我已经尝试使用带有 tomcat 的 Jax-rs 并使用所有注释,我能够使用 url 调用我的服务。因此,如果没有 Jax-rs,我可以简单地拥有一个 servlet 并调用我的服务。
是否有任何工具/商业混淆器可以混淆 WPF 控件中的 BAML 资源? 如果没有,就 IP 保护而言,这是一段艰难的时期,因为黑客可以通过使用 BAML 到 XAML 转换器轻松查看 BAML 资源。
嘿大家。我在尝试使用 COBOL 在 zOS 环境中解决的编码项目中遇到了一些麻烦。我需要读入一个文件并将它们放入索引表中(我知道将少于 90 条记录)。 让我感到困扰的是,我们受到项目参数的约束,以
我试图按照这个例子来理解 join() 方法: class PrintDemo { public void printCount() { try { for(int
当我编译我正在编写的代码,然后在 JD Gui 中查看时,方法显示带有如下标题: public void growSurface(Random paramRandom, int paramInt1,
我正在为重新分发准备 Android 库,它的代码必须进行混淆处理。我已经阅读了有关此主题的一些内容,并且决定使用 Android Library Project。它将作为 jar 分发(自动在/bi
两个混淆相关的问题: 1) 是否有任何工具可以将 F# 从 MSIL 目标形式反汇编回其源形式或接近它的形式?这不是通过默默无闻来实现安全性的尝试,但我想保护某些源代码免遭“盗窃”。 2) 我简要地查
谁能向我解释为什么 simulatedCase <- rbinom(100,1,0.5) simDf <- data.frame(CASE = simulatedCase) posterior_m0
我一直无法找到关于使用 AppDomains 时发生的事情的非常清楚的描述,所以希望有人能够启发我。我有一个简单的测试程序(基本上是扯掉了 MSDN example ): using System;
假设我有 2 个分支topic和 master如果我在 topic分支,然后运行 git rebase master它是 rebase master 还是 rebase 主题分支? 做 git r
我有一个类(class): public class LockTest { public void LockThis() { lock (this)
我正在尝试最小化/混淆我的 Angular 代码,但遇到了问题。我在这里阅读“缩小说明”http://docs.angularjs.org/tutorial/step_05但我定义我的 Control
我遇到了一些困惑的操作。 var a = 0.1; var b = 0.2; var c = 0.3; console.log(a); // 0.1 console.log(b); // 0.2 co
感谢您查看我的帖子 - 我正在尝试弄清楚如何在单击链接时关闭此下拉菜单,但我的 JavaScript 技能非常缺乏,而且代码似乎很困惑。这是 HTML:
混淆、哈希和加密之间有什么区别? 这是我的理解: 哈希是一种单向算法;无法逆转 混淆与加密类似,但不需要任何“ secret ”即可理解(ROT13 就是一个例子) 加密是可逆的,但需要“ secre
我有以下代码 my $content = $response->content; $content =~ /username=([\s\S]+?)&/; my $username = $1; prin
我在 .NET 中发现了一些与我预期的有点不同的东西。我粘贴的代码没有意义,但它是我拥有的一个复杂得多的函数的浓缩版。我实际上是在获取匿名类型信息作为参数(尚未创建匿名类型的实例),我需要创建该类型的
我正在努力解决 JavaFX 应用程序的混淆问题。使用此项目作为基础: https://github.com/openjfx/samples/tree/master/IDE/IntelliJ/Non-
是否可以制作一个与此类似的 CSV 阅读器 while((line = reader.readLine()) != null){ String[] values = line.
公共(public)类测试2 { 公共(public)静态无效主(字符串[]参数){ System.out.println("3 + 6"); System.out.println(3
我是一名优秀的程序员,十分优秀!