- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试填充行子集中的缺失值。我在 fillna()
中使用了 inplace=True
,但它在 jupyter notebook 中不起作用。您可以在 Surface 列的前两行看到显示 NaN 的附图。我不确定为什么?
我必须这样做才能正常工作。为什么?感谢您的帮助。
data.loc[mark,'Surface']=data.loc[mark,'Surface'].fillna(value='TEST')
这是我的代码
mark=(data['Pad']==51) | (data['Pad']==52) | (data['Pad']==53) | (data['Pad']==54) | (data['Pad']==55)
data.loc[mark,'Surface'].fillna(value='TEST',inplace=True)
这个正在工作:
data.loc[mark,'Surface']=data.loc[mark,'Surface'].fillna(value='TEST')
最佳答案
您在这里遇到的主要问题是 pandas
没有非常明确的 View 与复制规则。您的结果向我表明这里的问题是 .loc
返回的是副本而不是 View 。虽然 pandas 确实尝试从 .loc
返回一个 View ,但也有很多警告。
玩了一会儿之后,似乎使用 bool /位置索引掩码返回一个副本 - 您可以使用私有(private) _is_view
属性验证这一点:
import pandas as pd
import numpy as np
df = pd.DataFrame({"Pad": range(40, 60), "Surface": np.nan})
print(df)
Pad Surface
0 40 NaN
1 41 NaN
2 42 NaN
. ... ...
19 59 NaN
# Create masks
bool_mask = df["Pad"].isin(range(51, 56))
positional_mask = np.where(bool_mask)[0]
# Check `_is_view` after simple .loc:
>>> df.loc[bool_mask, "Surface"]._is_view
False
>>> df.loc[positional_mask, "Surface"]._is_view
False
因此,上述两种方法都不会返回原始数据的“ View ”,这就是执行 inplace
操作不会更改原始数据帧的原因。为了从 .loc
返回 View ,您需要使用切片作为行索引。
>>> df.loc[10:15, "Surface"]._is_view
True
现在这仍然无法解决您的问题,因为您填充 NaN
的值可能会也可能不会更改“Surface”列的 dtype
。在我设置的示例中,“Surface”具有 float64 dtype- 并且通过使用值“Test”填充 NaN
,您强制更改与原始数据帧不兼容的 dtype。如果您的“表面”列是 object
dtype,那么您无需担心这一点。
>>> df.dtypes
Pad int64
Surface float64
# this does not work because "Test" is incompatible with float64 dtype
>>> df.loc[10:15, "Surface"].fillna("Test", inplace=True)
# this works because 0.9 is an appropriate value for a float64 dtype
>>> df.loc[10:15, "Surface"].fillna(0.9, inplace=True)
>>> print(df)
Pad Surface
.. ... ...
8 48 NaN
9 49 NaN
10 50 0.9
11 51 0.9
12 52 0.9
13 53 0.9
14 54 0.9
15 55 0.9
16 56 NaN
17 57 NaN
.. ... ...
TLDR;一般来说,不要依赖 pandas 中的 inplace
。在其大部分操作中,它仍然会创建基础数据的副本,然后 attempts to replace the original source with the new copy . Pandas 的内存效率不高,所以如果你担心内存性能,你可能想切换到设计为从头开始零复制的东西,比如 Vaex ,而不是尝试通过 pandas。
您分配数据帧切片的方法是最合适的,并且将确保您收到尽可能“就地”更新数据帧的正确结果:
>>> df.loc[bool_mask, "Surface"] = df.loc[bool_mask, "Surface"].fillna("Test")
关于python - inplace=True 不适用于子集数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68352823/
我在我的 Xcode 项目目录中输入了以下内容: keytool -genkey -v -keystore release.keystore -alias mykey -keyalg RSA \
假设我有一个像这样的 DataFrame(或 Series): Value 0 0.5 1 0.8 2 -0.2 3 None 4 None 5 None
我正在对一个 Pandas 系列进行相对繁重的应用。有什么方法可以返回一些打印反馈,说明每次调用函数时在函数内部进行打印还有多远? 最佳答案 您可以使用跟踪器包装您的函数。以下两个示例,一个基于完成的
我有一个 DataFrame,其中一列包含列表作为单元格内容,如下所示: import pandas as pd df = pd.DataFrame({ 'col_lists': [[1, 2
我想使用 Pandas df.apply 但仅限于某些行 作为一个例子,我想做这样的事情,但我的实际问题有点复杂: import pandas as pd import math z = pd.Dat
我有以下 Pandas 数据框 id dist ds 0 0 0 0 5 1 0 0 7 2 0 0
这发生在我尝试使用 Gradle 构建时。由于字符串是对象,因此似乎没有理由发生此错误: No signature of method: java.util.HashMap.getOrDefault(
您好,有人可以解释为什么在 remaining() 函数中的 Backbone 示例应用程序 ( http://backbonejs.org/examples/todos/index.html ) 中
我有两个域类:用户 class User { String username String password String email Date dateCreated
问题陈述: 一个 pandas dataframe 列系列,same_group 需要根据两个现有列 row 和 col 的值从 bool 值创建。如果两个值在字典 memberships 中具有相似
apporable 报告以下错误: error: unknown type name 'MKMapItem'; did you mean 'MKMapView'? MKMapItem* destina
我有一个带有地址列的大型 DataFrame: data addr 0 0.617964 IN,Krishnagiri,635115 1 0.635428 IN,Chennai
我有一个列表list,里面有这样的项目 ElementA: Number=1, Version=1 ElementB: Number=1, Version=2 ElementC: Number=1,
我正在编译我的源代码,它只是在没有运行应用程序的情况下终止。这是我得到的日志: Build/android-armeabi-debug/com.app4u.portaldorugby/PortalDo
我正在尝试根据另一个单元格的值更改单元格值(颜色“红色”或“绿色”)。我运行以下命令: df.loc[0, 'Colour'] = df.loc[0, 'Count'].apply(lambda x:
我想弄清楚如何使用 StateT结合两个 State基于对我的 Scalaz state monad examples 的评论的状态转换器回答。 看来我已经很接近了,但是在尝试申请 sequence
如果我已经为它绑定(bind)了集合,我该如何添加 RibbonLibrary 默认的快速访问项容器。当我从 UI 添加快速访问工具项时,它会抛出 Operation is not valid whi
在我学习期间Typoclassopedia我遇到了这个证明,但我不确定我的证明是否正确。问题是: One might imagine a variant of the interchange law
我是一名优秀的程序员,十分优秀!