- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我在 Pandas 中处理一个大型数据集(超过 18000000 行,8 列)并且想将某些行中的其中一列分配给 True。我使用分层索引并将我的 DataFrame 结构化如下:
col1 col2 ... col8
name position
"name2" 1 False -0.827317 0.569605
2 False -0.273178 0.997953
3 False -0.827317 0.569605
... ... ... ... ...
15000 False -0.827317 0.569605
15001 False -0.001015 0.569605
"name2" 1 False -0.827317 0.827317
2 False -0.827317 0.569605
3 False -0.827317 0.001015
... ... ... ... ...
15000 False -0.827317 0.569605
15001 False -0.998997 0.569605
"name3" 1 False -0.827317 0.569605
2 False -0.827317 0.000000
3 False -0.827317 0.569605
... ... ... ... ...
15000 False -0.998997 0.569605
15001 False -0.827317 0.998997
... ... ... ... ... ...
我想根据之前在 col1 中的计算为 true 分配某些位置。我想对我的“名称”索引中的所有索引执行此操作。
所以首先我尝试使用这个元组索引来选择正确的行。
df.loc[(all_names, positions), 'col1'] = True
它可以工作,但是速度非常慢,这使得它在实践中无法使用。我尝试在 Jupyter Notebook 中计时,但当我使用 %%timeit
时 iPython 内核崩溃了。
然后我尝试使用这段代码:
for name in all_names:
df.loc[name].loc[positions, 'col1'] = True
令我惊讶的是,它至少快了 10 倍。我知道使用 df.loc[].loc[] = True
不是解决此问题的合适方法,因为 A value is trying to be set on a copy of a slice from一个 DataFrame。
但它实际上按我想要的方式工作,并且设置了所有正确的值。但是还是很慢(整个数据集大约需要1分钟)
我认为迭代所有名称肯定不是最快的方法,所以我尝试使用切片器
df.loc[(slice(None), positions), 'col1'] = True
但它的表现与我的第一次尝试相同。
使用分层索引选择和分配特定值的最佳和最快方法是什么?当想在第一级使用所有索引然后在第二级仅使用一些索引时。
最佳答案
由于要选择 multiIndex 的每个 name
部分,可能会尝试通过 get_level_values(1)
进行索引,其中 (1) 表示 position
:
df.loc[df.index.get_level_values(1).isin(positions), 'col1'] = True
尝试看看是否能提供任何加速。
关于python - 使用分层索引(MultiIndex)快速选择和分配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57610473/
在 Django 中如何处理分层 URL?有什么最佳做法吗?例如。如果我有一个像 /blog/category1/category2/myblogentry 这样的 URL(使用例如 django-m
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
有没有办法在 R 中创建这样的图表? 以下是图表中显示的数据的摘录: df % group_by(Animal) %>% unite(col=Type, Animal:Name, sep =
我一直在努力处理一些时间戳数据(直到现在才需要处理日期,并且它表明)。希望您能帮忙。 我正在处理来自网站的数据,该数据显示每个客户 (ID) 各自的访问以及这些访问的时间戳。它的分组是指一个客户可能有
我一直在努力处理一些时间戳数据(直到现在才需要处理日期,并且它表明)。希望您能帮忙。 我正在处理来自网站的数据,该数据显示每个客户 (ID) 各自的访问以及这些访问的时间戳。它的分组是指一个客户可能有
我正在尝试完成这段代码: ORDER BY IF(j.groups IS NULL OR j.groups = '', IF(j.title IS NULL, i.title), j.groups)
我有一个非常抽象的问题,因为我不确定如何提出它。我的其中一个 View 上有一个 UIImageView。我想让 ImageView 看起来“压入 super View ”。我不确定技术术语是什么,但
我希望 100% 宽的包含图像的 div 位于我的页面下方。在这些 div 之上,我想要一个 1210 像素宽的 div,我可以在其中放置我的内容。 例子: http://mudchallenger.
我目前正在做一个类似于 http://www.beoplay.com/Products/BeoplayA9#under-the-hood 的元素使用 Javascript、HTML5 和 CSS3。我
我想像上面那样创建图像缩略图..为此,我在下面创建了 XML activity_main.xml
我想知道是否可以定义一个分层 MapReduce 作业?。换句话说,我想要一个 map-reduce 作业,在 mapper 阶段将调用不同的 MapReduce 作业。可能吗?您对如何操作有什么建议
程序设计: A 类,实现较低级别的数据处理 类 B-E,为 A 提供更高级别的接口(interface)以执行各种功能 F 类,它是根据用户输入与 B-E 交互的 UI 对象 在任何给定时间只能有一个
CTE 对我来说有点新,所以我希望有人可以帮助我编写的以下内容将采用类别表并从中构建层次结构以进行显示。我知道这种事情一直被问到,但我认为我的排序情况使它有点独特。 我希望有一些使用 Hierarch
我有关于 的问题群 在聚类分析(层次聚类)中。例如,这是 的完全链式的树状图。虹膜数据集 . 我使用后 > table(cutree(hc, 3), iris$Species) 这是输出 : se
数据 我有以下(简化的)数据集,我们称之为 df从现在开始: species rank value 1
Delphi 2009 中的分层窗口和系统菜单存在问题。也就是说,我们的分层窗口(没有边框)没有系统菜单。当我说系统菜单时,我指的是单击应用程序的图标、右键单击其标题栏或(在 Windows 7 中,
我正在制作一个 pototype HMTL5 Canvas 动画,该动画将导出到 Quicktime。 我有一个动态生成的背景,上面有动态屏蔽的元素。 我可以获取要制作的背景,并将其作为逐帧动画(pn
好吧,我有一个打印棋盘的类和另一个打印国际象棋的类 如何使用 LayeredPane 将它们合并在一起,如上面的示例图片所示?我一整天都在尝试,但似乎没有任何效果。我正在使用 JFrame 打印图片。
这是我的场景。我有两个类(class) ClassA 和 ClassB。 B类继承A类。 我在它们两个上使用@Component注释来使它们成为Spring bean。 @Component publ
这不是一道问题题,而是一道使用工具——leiningen——的题。 在一个主项目下创建分层的 lein 项目是否有优势,如果有,优势是什么? 如果我使用 lein new bene-cmp 创建一个项
我是一名优秀的程序员,十分优秀!