- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个包含三列的数据框 A:“id”、“value”和“date”。我正在按 id 进行 groupby,并注意到一些奇怪的事情:如果我对具有给定 id 的行进行两次连续排序,首先按值然后按日期,操作顺序会影响行的顺序。注意索引为 42915 和 42916 的行的顺序:
A.sort_values('value').sort_values('date')[A.sort_values('value').sort_values('date')['id'] == '0001249666']
id value date
42913 0001249666 113845.0 20130408
42914 0001249666 114597.0 20130430
42916 0001249666 125972.0 20140414
42915 0001249666 125971.0 20140414
42917 0001249666 136154.0 20150410
42918 0001249666 145551.0 20160407
42919 0001249666 152911.0 20170413
A[A['id'] == '0001249666'].sort_values('value').sort_values('date')
id value date
42913 0001249666 113845.0 20130408
42914 0001249666 114597.0 20130430
42915 0001249666 125971.0 20140414
42916 0001249666 125972.0 20140414
42917 0001249666 136154.0 20150410
42918 0001249666 145551.0 20160407
42919 0001249666 152911.0 20170413
但是,如果我使用带有两个参数的 .sort_values,顺序无关紧要。
A.sort_values(['date','value'])[A.sort_values(['date','value'])['id'] == '0001249666']
id value date
42913 0001249666 113845.0 20130408
42914 0001249666 114597.0 20130430
42915 0001249666 125971.0 20140414
42916 0001249666 125972.0 20140414
42917 0001249666 136154.0 20150410
42918 0001249666 145551.0 20160407
42919 0001249666 152911.0 20170413
a[a['id'] == '0001249666'].sort_values(['date','value'])
id value date
42913 0001249666 113845.0 20130408
42914 0001249666 114597.0 20130430
42915 0001249666 125971.0 20140414
42916 0001249666 125972.0 20140414
42917 0001249666 136154.0 20150410
42918 0001249666 145551.0 20160407
42919 0001249666 152911.0 20170413
现在我知道我正在做的并不是我想做的最聪明的方法,但我真的很想了解什么可以解释这种行为?当我不理解这种行为时,我隐含地假设了什么。
最佳答案
问题是排序算法不是stable ,因此具有相同排序值的行(当您有多个具有相同 date
的行时会发生这种情况)可能会相对于它们的原始相对顺序被打乱。这意味着,如果您对数据框调用排序两次,第一次排序将不会产生任何(可预测的)效果,因为第二次排序只会根据其自身的标准进行排序。 sort_values
支持多种排序算法;如文档所述,默认为快速排序,但如果需要,您可以通过 kind='mergesort'
进行稳定排序。
显然,当您传递两列作为排序依据时,排序算法会同时考虑它们,因此排序会按预期进行。
关于python - 在 Pandas 中排序两次,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49110120/
我正在尝试对每个条目有多个值的关联数组进行排序。 例如 [0] => stdClass Object ( [type] => node [sid] => 158 [score] => 0.059600
我在 mysql 中有“日期”列以这种格式保存日期 2014 年 9 月 17 日(日-月-年) 我需要对它们进行升序排序,所以我使用了这个命令: SELECT * FROM table ORDER
我目前正在将 MySQL 存储过程重写为 MS SQL 存储过程,但遇到了问题。 在 MySQL 存储过程中,有一个游标,它根据最近的日期 (effdate) 选择一个值并将其放入变量 (thestt
我想要 gwt r.QuestionId- 排序。但是我得到未排序的 QuestionId 尽管我提到了 QuestionId ASC 的顺序。 SELECT r.QuestionId,
我有一个关于在 scandir 函数中排序的基本问题。到目前为止,我阅读了 POSIX readdir 的手册页,但没有找到有关订购保证的具体信息。 但是当我遍历大目录(无法更改,只读)时,我在多个系
基本上我必须从 SQL 数据库中构建项目列表,但是用户可以选择对 7 个过滤器的任意组合进行过滤,也可以选择要排序的列以及按方向排序。 正如您可以想象的那样,这会以大量不同的组合进行编码,并且数据集非
我有两张 table 。想象第一个是一个目录,包含很多文件(第二个表)。 第二个表(文件)包含修改日期。 现在,我想选择所有目录并按修改日期 ASC 对它们进行排序(因此,最新的修改最上面)。我不想显
我想先根据用户的状态然后根据用户名来排序我的 sql 请求。该状态由 user_type 列设置: 1=活跃,2=不活跃,3=创始人。 我会使用此请求来执行此操作,但它不起作用,因为我想在“活跃”成员
在 C++ 中,我必须实现一个“类似 Excel/Access”(引用)的查询生成器,以允许对数据集进行自定义排序。如果您在 Excel 中使用查询构建器或 SQL 中的“ORDER BY a, b,
我面临这样的挑战: 检索按字段 A 排序的文档 如果字段 B 存在/不为空 . 否则 按字段排序 C. 在 SQL 世界中,我会做两个查询并创建一个 UNION SELECT,但我不知道如何从 Mon
我想对源列表执行以下操作: map 列表 排序 折叠 排序 展开 列表 其中一些方法(例如map和toList)是可链接的,因为它们返回非空对象。但是,sort 方法返回 void,因为它对 List
我制作了一个用于分析 Windows 日志消息编号的脚本。 uniq -c 数字的输出很难预测,因为根据数字的大小会有不同的空白。此时,我手动删除了空白。 这是对消息进行排序和计数的命令: cat n
我有以下词典: mydict1 = {1: 11, 2: 4, 5: 1, 6: 1} mydict2 = {1: 1, 5: 1} 对于它们中的每一个,我想首先按值(降序)排序,然后按键(升序)排序
我刚刚开始使用泛型,目前在对多个字段进行排序时遇到问题。 案例: 我有一个 PeopleList 作为 TObjectList我希望能够通过一次选择一个排序字段,但尽可能保留以前的排序来制作类似 Ex
有没有办法在 sql 中组合 ORDER BY 和 IS NULL 以便我可以在列不为空时按列排序,但如果它为null,按另一列排序? 最佳答案 类似于: ORDER BY CASE WHEN
我有一个包含 2 列“id”和“name”的表。 id 是常规的自动增量索引,name 只是 varchar。 id name 1 john 2 mary 3 pop 4 mary 5 j
场景 网站页面有一个带有分页、过滤、排序功能的表格 View 。 表中的数据是从REST API服务器获取的,数据包含数百万条记录。 数据库 REST API 服务器 Web 服务器 浏览器 问
假设我有一本字典,其中的键(单词)和值(分数)如下: GOD 8 DONG 16 DOG 8 XI 21 我想创建一个字典键(单词)的 NSArray,首先按分数排序,然后按字
如何在 sphinx 上通过 sql 命令选择前 20 行按标题 WEIGHT 排序,接下来 20 行按标题 ASC 排序(总共 40 个结果),但不要给出重复的标题输出。 我尝试了这个 sql 命令
我有一个奇怪的问题,当从 SQLite 数据库中选择信息并根据日期排序时,返回的结果无效。 我的SQL语句是这样的: Select pk from usersDates order by dateti
我是一名优秀的程序员,十分优秀!