- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我的 DataFrames
大小在 100k 到 2m 之间。我正在处理这个问题的那个很大,但请注意,我必须对其他框架做同样的事情:
>>> len(data)
357451
现在这个文件是由很多文件编译而成的,所以它的索引真的很奇怪。所以我想做的就是用 range(len(data))
重新索引它,但我得到了这个错误:
>>> data.reindex(index=range(len(data)))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/frame.py", line 2542, in reindex
fill_value, limit)
File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/frame.py", line 2618, in _reindex_index
limit=limit)
File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/index.py", line 893, in reindex
limit=limit)
File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/pandas/core/index.py", line 812, in get_indexer
raise Exception('Reindexing only valid with uniquely valued Index '
Exception: Reindexing only valid with uniquely valued Index objects
这实际上是没有意义的。由于我正在使用包含数字 0 到 357450 的数组重新编制索引,因此所有 Index 对象都是唯一的!为什么会返回此错误?
额外信息:我正在使用 python2.7 和 pandas 11.0
最佳答案
当它提示 Reindexing only valid with uniquely valued Index
时,它并不是反对您的新索引不是唯一的,而是反对您的旧索引不是.
例如:
>>> df = pd.DataFrame(range(5), index = [1,2,3,1,2])
>>> df
0
1 0
2 1
3 2
1 3
2 4
>>> df.reindex(index=range(len(df)))
Traceback (most recent call last):
[...]
File "/usr/local/lib/python2.7/dist-packages/pandas-0.12.0.dev_0bd5e77-py2.7-linux-i686.egg/pandas/core/index.py", line 849, in get_indexer
raise Exception('Reindexing only valid with uniquely valued Index '
Exception: Reindexing only valid with uniquely valued Index objects
但是
>>> df.index = range(len(df))
>>> df
0
0 0
1 1
2 2
3 3
4 4
虽然我想我会写
df.reset_index(drop=True)
相反。
关于python - 重新索引错误没有意义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16327412/
我正在使用 Gunicorn 为 Django 应用程序提供服务,它工作正常,直到我将其超时时间从 30 秒更改为 900000 秒,我不得不这样做,因为我有一个用例需要上传和处理一个巨大的文件(过程
我有一个带有非常基本的管道的Jenkinsfile,它可以旋转docker容器: pipeline { agent { dockerfile { args '-u root' } } stag
在学习 MEAN 堆栈的过程中,我遇到了一个问题。每当我尝试使用 Passport 验证方法时,它都不会返回任何响应。我总是收到“localhost没有发送任何数据。ERR_EMPTY_RESPONS
在当今的大多数企业堆栈中,数据库是我们存储所有秘密的地方。它是安全屋,是待命室,也是用于存储可能非常私密或极具价值的物品的集散地。对于依赖它的数据库管理员、程序员和DevOps团队来说,保护它免受所
是否可以创建像图片上那样的边框?只需使用 css 边框属性。最终结果将是没 Angular 盒子。我不想添加额外的 html 元素。我只想为每个 li 元素添加 css 边框信息。 假设这是一个 ul
我是一名优秀的程序员,十分优秀!