- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
根据 pandas
文档,应该可以使用 setting with enlargment 将不存在的行追加到 DataFrame
中,但是虽然检索多个丢失的键工作正常,设置多个丢失的键会抛出KeyError
:
import pandas as pd
print(pd.__version__) # '0.19.2'
df = pd.DataFrame([[9] * 3] * 3, index=list('ABC'))
## Show a mix of extant and missing keys:
inds_e = pd.Index(list('BCDE'))
print(df.loc[inds_e])
# 0 1 2
# B 9.0 9.0 9.0
# C 9.0 9.0 9.0
# D NaN NaN NaN
# E NaN NaN NaN
## Assign the enlarging subset to -1:
try:
df.loc[inds_e] = -1
except KeyError as e:
print(e)
# "Index(['D', 'E'], dtype='object') not in index"
设置多个现有键效果很好,并且设置任意一行的放大效果也很好:
## Assign all the non-missing keys at once:
inds_nm = inds_e.intersection(df.index)
df.loc[inds_nm] = -1
## Assign the missing keys one at a time:
inds_m = inds_e.difference(df.index)
for ind in inds_m:
df.loc[ind] = -1
print(df)
# 0 1 2
# A 9 9 9
# B -1 -1 -1
# C -1 -1 -1
# D -1 -1 -1
# E -1 -1 -1
也就是说,这看起来非常不优雅且效率低下。有一个very similar question here ,但这是使用 combine_first()
功能解决的 - 两者 combine_first()
和 update()
方法似乎没有与简单赋值相同的语义 - 在 combine_first
的情况下,非空值不会更新,而在 update
的情况下,右侧数据框中的空值不会覆盖左侧数据框中的非空值。
这是pandas
中的一个错误吗?如果不是,那么在pandas
上将值分配给现有和缺失键的混合的“正确”方法是什么? > 数据框?
编辑:看起来像 there is an issue about this from 2014在 pandas
github 上。事实上,显然是使用 df.reindex ,但我不清楚当您尝试分配所有键的子集并进行放大时,它是如何工作的。
最佳答案
根据您的编辑,您可以使用 reindex
进行重叠和放大分配在两个索引的并集上,后跟 loc
:
# Reindex to add the missing indicies (fill_value preserves integer dtype).
df = df.reindex(df.index.union(inds_e), fill_value=-1)
# Perform the assignment.
df.loc[inds_e] = -1
看起来这在这里做了一些额外的分配,因为 loc
将双重填充 fill_value
处理的一些值。几个简单的计时似乎表明,双重填充比仅确定要填充的剩余位置更快。您也不一定需要使用 fill_value
;我只是在本例中使用它来保留数据类型。如果您使用 float 而不是整数,则完全没有必要。
结果输出:
0 1 2
A 9 9 9
B -1 -1 -1
C -1 -1 -1
D -1 -1 -1
E -1 -1 -1
时间
这看起来确实相当有效。使用以下设置生成更大的示例:
n = 10**5
df = pd.DataFrame(np.random.randint(1000, size=(n, 4)))
inds = pd.Index(range(n//2, 3*n//2))
def root(df, inds):
df = df.reindex(df.index.union(inds), fill_value=-1)
df.loc[inds] = -1
return df
def paul(df, inds):
## Assign all the non-missing keys at once:
inds_nm = inds.intersection(df.index)
df.loc[inds_nm] = -1
## Assign the missing keys one at a time:
inds_m = inds.difference(df.index)
for ind in inds_m:
df.loc[ind] = -1
return df
我得到以下时间:
%timeit root(df.copy(), inds)
100 loops, best of 3: 16.5 ms per loop
我无法使用 n=10**5
运行您的解决方案。使用n=10**4
:
%timeit paul(df.copy(), inds)
1 loop, best of 3: 14.1 s per loop
关于python - 设置 pandas 多行并放大,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41864014/
这个问题已经有答案了: Is there any way to accept only numeric values in a JTextField? (20 个回答) It's possible i
我使用戴尔 XPS M1710。笔记本电脑的盖子、侧面扬声器和前置扬声器都有灯(3 组灯可以单独调节)和鼠标垫下方的灯。在 BIOS 中,我可以更改这些灯的颜色,至少是每个组。另外,我可以在鼠标垫下打
我知道我可以使用 在 iOS 5 中打开设置应用 [[UIApplication sharedApplication] openURL:[NSURL URLWithString:@"prefs://"
我有一个 Django 应用程序,我正在尝试为其设置文档。目录结构如下: - doc - project | - manage.py 我已经设置了路径以便 Sphinx 可以看到东西,但是当我尝试使用
我正在使用 768mb ram 运行 centos 5.5。我一直在日志中获取 server reached MaxClients setting, consider raising the MaxC
我在具有以下配置的服务器内运行了 Drupal 安装: StartServers 5 MinSpareServers 5 MaxSpareServers 15 MaxClien
是否可以使用 Microsoft.Web.Administration 包为给定的 location 配置 asp 设置? 我想以编程方式将以下部分添加到本地 IIS applicationHost.
我一直在阅读为 kube-proxy 提供参数的文档,但没有解释应该如何使用这些参数。我使用 az aks create 创建我的集群使用 azure-cli 程序,然后我获得凭据并使用 kubect
我想知道与在 PHP 中使用 setcookie() 函数相比,在客户端通过 JavaScript 设置一些 cookie 是否有任何明显的优势?我能想到的唯一原因是减少一些网络流量(第一次)。但不是
我有一个按钮可以将 body class 设置为 .blackout 我正在使用 js-cookie设置cookie,下面的代码与我的按钮相关联。 $('#boToggle').on('click'
我有一堆自定义的 HTML div。我将其中的 3 存储在具有 slide 类的 div 中。然后,我使用该幻灯片类调用 slick 函数并应用如下设置: $('.slide').slick({
我正在创建一个应该在 Windows 8(桌面)上运行的应用 我需要: 允许用户使用我的应用启动“文件历史记录”。我需要找到打开“文件历史记录”的命令行。 我需要能够显示“文件历史记录”的当前设置。
我刚买了一台新的 MacBook Pro,并尝试在系统中设置 RVM。我安装了 RVM 并将默认设置为 ➜ rvm list default Default Ruby (for new shells)
由于有关 Firestore 中时间戳行为即将发生变化的警告,我正在尝试更改我的应用的初始化代码。 The behavior for Date objects stored in Firestore
在 ICS 中,网络 -> 数据使用设置屏幕中现在有“限制后台数据”设置。 有没有办法以编程方式为我的应用程序设置“限制后台数据”? 或 有没有办法为我的应用程序调出具有选项的“数据使用”设置? 最佳
我正在尝试使用 NextJS 应用程序设置 Jest,目前在 jest.config.js : module.exports = { testPathIgnorePatterns: ["/.n
我最近升级到 FlashDevelop 4,这当然已经将我之前的所有设置恢复到原来的状态。 我遇到的问题是我无法在新设置窗口的哪个位置找到关闭它在方括号、大括号等之前插入的自动空格的选项。 即它会自动
有没有办法以编程方式访问 iPhone/iPod touch 设置? 谢谢。比兰奇 最佳答案 大多数用户设置可以通过读取存储在 /User/Library/Preferences/ 中的属性列表来访问
删除某些值时,我需要选择哪些设置来维护有序队列。我创建了带有自动增量和主键的 id 的表。当我第一次插入值时,没问题。就像 1,2,3,4,5... 当删除某些值时,顺序会发生变化,例如 1,5,3.
我正在尝试设置示例 Symfony2 项目,如此处所示 http://symfony.com/doc/current/quick_tour/the_big_picture.html 在访问 confi
我是一名优秀的程序员,十分优秀!