- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有几个系列的可变长度列表,其中有一些空值。一个例子是:
In [108]: s0 = pd.Series([['a', 'b'],['c'],np.nan])
In [109]: s0
Out[109]:
0 [a, b]
1 [c]
2 NaN
dtype: object
但另一个包含所有 NaN
:
In [110]: s1 = pd.Series([np.nan,np.nan])
In [111]: s1
Out[111]:
0 NaN
1 NaN
dtype: float64
我需要每个列表中的最后一项,这很简单:
In [112]: s0.map(lambda x: x[-1] if isinstance(x,list) else x)
Out[112]:
0 b
1 c
2 NaN
dtype: object
但是在谈到这一点时,我发现,如果没有 isinstance
,当索引在 NaNs
上阻塞时 它在 s0< 上的表现非常不同
和 s1
:
In [113]: s0.map(lambda x: x[-1])
...
TypeError: 'float' object is not subscriptable
In [114]: s1.map(lamda x: x[-1])
...
IndexError: invalid index to scalar variable.
谁能解释一下为什么?这是一个错误吗?我正在使用 Pandas 0.16.2 和 Python 3.4.3。
最佳答案
从本质上讲,这实际上是一个 NumPy 问题,而不是 pandas 问题。
map
遍历列中的值,一次将它们传递给 lambda
函数。在下面,pandas 中的列/系列只是 NumPy 数组的(切片),因此 pandas 定义了以下 helper function从函数的底层数组中获取值。这由 map
在每次迭代时调用:
PANDAS_INLINE PyObject*
get_value_1d(PyArrayObject* ap, Py_ssize_t i) {
char *item = (char *) PyArray_DATA(ap) + i * PyArray_STRIDE(ap, 0);
return PyArray_Scalar(item, PyArray_DESCR(ap), (PyObject*) ap);
}
关键位是 PyArray_Scalar
,这是一个 NumPy API 函数,它复制 NumPy 数组的一部分以返回标量值。
构成该函数的代码太长,无法贴在这里,但是here's在代码库中的哪里可以找到它。我们只需要知道它返回的标量将匹配它所使用的数组的数据类型。
回到你的系列:s0
有 object
dtype 而 s1
有 float64
dtype。这意味着 PyArray_Scalar
将为每个系列返回不同类型的标量;分别是一个实际的 Python float
对象和一个 NumPy 标量浮点对象:
>>> type(s0[2])
float
>>> type(s1[0])
numpy.float64
NaN
值作为两种不同的类型返回,因此当您尝试使用 lambda
函数对它们进行索引时会出现不同的错误。
关于python - pandas IndexError/TypeError 与 NaN 值不一致,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34398004/
我在cmd中发起了焰火,并在下面进行了表演,以提高我的技能。。当我执行a.take(1)时,我得到“_ickle.PicklingError:无法序列化对象:IndexError:tuple inde
关闭。这个问题需要details or clarity .它目前不接受答案。 想改进这个问题?通过 editing this post 添加详细信息并澄清问题. 1年前关闭。 Improve this
如果我测试以下“空”条件,则会得到一个IndexError,指出字符串索引超出范围。这是为什么?如果用户输入为空,我希望脚本打印“空”。 pyg = 'ay' original = raw_input
我在 occurence[j] = 0 上收到错误消息.我真的不明白我的代码中这个错误的起源,因为它的长度是 dna,因为我在代码的顶部附加了 len(dna)零,然后我将一些值分配给同一个列表 oc
我正在阅读python上的视频帧,并且试图找到每个帧索引的RGB。我需要检测LED(将阈值设置为开/关-红色/黑色),但是我遇到了索引编制问题。 我需要访问图像左下角的RGB值。 # Check if
你能告诉我为什么我必须在 try/except 语句中包含这个 if 吗?当我使用列表调用函数时,此方法会引发 IndexError ,其中最后一个元素与列表中的其他元素相同。当最后一个元素在列表中仅
我需要帮助对我的键值对进行排序。我的输出位于此网址 http://pastebin.com/ckKAtP5y 中。然而,我一直在努力做的是。 { "courses": [ {
我知道索引会超过该组最后一个成员的索引,但如何使该功能正常工作? 无论如何,该函数的目的是检查列表中的所有成员是否相同。我对另一个函数有同样的问题,该函数旨在检查列表是否按顺序排列。它适用于其他所有内
请考虑以下代码吗? start_list = [5, 3, 1, 2, 4] square_list = [] for i in start_list: square_list.append(
我正在尝试找出它抛出该错误的原因。元组的长度应该是 4,确实是。有什么提示、想法吗? 此代码适用于我正在为 Udacity 编程入门 nano 学位开展的瑞士风格项目。 相关代码Python代码来自t
已更新,看底! 我卡住了!我收到一个 IndexError: list index out of range 错误。 def makeInverseIndex(strlist): numStr
我想我是在问一个新手问题,但今天花了太多时间寻找答案。在使用 np.genfromtxt 保存和重新加载后天真地尝试对 numpy 数组执行相同的切片操作时,我收到了 IndexError: too
我一直在做一个井字游戏的程序,需要两个玩家轮流输入棋盘坐标,比如 (r1,c1)->(r2,c2)-> (r3,c3)-> …,其中 r 是行,c 是列,棋盘看起来像 0 1 2 3 4 5 6 7
一些背景知识: 我正在编写一个基于单词的小型迷宫游戏,从一个由 X、O 和 F 组成的简单迷宫开始。 我的迷宫是代表迷宫本身的列表列表,其中 X 是一堵墙,O 是一个开放点,F 是终点线。 我正在尝试
s="(8+(2+4))" def checker(n): if len(n) == 0: return True if n[0].isdigit==True: if n[1].isd
我在图表上搜索单词的代码如下: size = len(word) height = len(diagram) width = len(diagram[0]) for i in range(0, hei
我有 Python 代码在列表中搜索字符串并将相应的参数存储到变量。 “X”下方的列表由单引号中的逗号分隔,这是我的实际逻辑 map1 = str(val).split('MAP:')[1].spli
这个问题在这里已经有了答案: How to remove items from a list while iterating? (25 个答案) 关闭 6 年前。 我是 Python 初学者。之前学
a = [1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89] for i in a: print(a[i]) IndexError: list index out of
在我使用 python 实现的合并排序中,运行时发生错误 IndexError: list assignment index out of range 这是代码: #merge def merge(a
我是一名优秀的程序员,十分优秀!