python - inplace=True 不适用于子集数据-6ren

python - inplace=True 不适用于子集数据

转载作者：行者123 更新时间：2023-12-04 12:32:06

25

4

我正在尝试填充行子集中的缺失值。我在 fillna() 中使用了 inplace=True，但它在 jupyter notebook 中不起作用。您可以在 Surface 列的前两行看到显示 NaN 的附图。我不确定为什么？

我必须这样做才能正常工作。为什么？感谢您的帮助。

data.loc[mark,'Surface']=data.loc[mark,'Surface'].fillna(value='TEST')

这是我的代码

mark=(data['Pad']==51) | (data['Pad']==52) | (data['Pad']==53) | (data['Pad']==54) | (data['Pad']==55)

data.loc[mark,'Surface'].fillna(value='TEST',inplace=True)

这个正在工作:

data.loc[mark,'Surface']=data.loc[mark,'Surface'].fillna(value='TEST')

最佳答案

您在这里遇到的主要问题是 pandas 没有非常明确的 View 与复制规则。您的结果向我表明这里的问题是 .loc 返回的是副本而不是 View 。虽然 pandas 确实尝试从 .loc 返回一个 View ，但也有很多警告。

玩了一会儿之后，似乎使用 bool /位置索引掩码返回一个副本 - 您可以使用私有(private) _is_view 属性验证这一点:

import pandas as pd
import numpy as np

df = pd.DataFrame({"Pad": range(40, 60), "Surface": np.nan})

print(df)
   Pad  Surface
0   40      NaN
1   41      NaN
2   42      NaN
.  ...      ...
19  59      NaN


# Create masks
bool_mask = df["Pad"].isin(range(51, 56))
positional_mask = np.where(bool_mask)[0]

# Check `_is_view` after simple .loc:
>>> df.loc[bool_mask, "Surface"]._is_view
False

>>> df.loc[positional_mask, "Surface"]._is_view
False

因此，上述两种方法都不会返回原始数据的“ View ”，这就是执行 inplace 操作不会更改原始数据帧的原因。为了从 .loc 返回 View ，您需要使用切片作为行索引。

>>> df.loc[10:15, "Surface"]._is_view
True

现在这仍然无法解决您的问题，因为您填充 NaN 的值可能会也可能不会更改“Surface”列的 dtype。在我设置的示例中，“Surface”具有 float64 dtype- 并且通过使用值“Test”填充 NaN，您强制更改与原始数据帧不兼容的 dtype。如果您的“表面”列是 object dtype，那么您无需担心这一点。

>>> df.dtypes
Pad          int64
Surface    float64

# this does not work because "Test" is incompatible with float64 dtype
>>> df.loc[10:15, "Surface"].fillna("Test", inplace=True)

# this works because 0.9 is an appropriate value for a float64 dtype
>>> df.loc[10:15, "Surface"].fillna(0.9, inplace=True)
>>> print(df)
    Pad  Surface
..  ...      ...
8    48      NaN
9    49      NaN
10   50      0.9
11   51      0.9
12   52      0.9
13   53      0.9
14   54      0.9
15   55      0.9
16   56      NaN
17   57      NaN
..  ...      ...

TLDR；一般来说，不要依赖 pandas 中的 inplace。在其大部分操作中，它仍然会创建基础数据的副本，然后 attempts to replace the original source with the new copy . Pandas 的内存效率不高，所以如果你担心内存性能，你可能想切换到设计为从头开始零复制的东西，比如 Vaex ，而不是尝试通过 pandas。

您分配数据帧切片的方法是最合适的，并且将确保您收到尽可能“就地”更新数据帧的正确结果:

>>> df.loc[bool_mask, "Surface"] = df.loc[bool_mask, "Surface"].fillna("Test")

关于python - inplace=True 不适用于子集数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/68352823/

25

4

0

文章推荐： sql - 在SQL中查找每个组对应的第N个值和平均值

文章推荐： regex - Notepad++ REGEX 查找并替换倒数第二个斜杠

文章推荐： r - 如何从 2 个或更多矩阵的所有可能组合创建矩阵？

文章推荐：发送到服务器后删除 C# HttpClient 授权 header

android - 适用:找不到release.keystore
我在我的 Xcode 项目目录中输入了以下内容: keytool -genkey -v -keystore release.keystore -alias mykey -keyalg RSA \
python - Pandas 适用，但访问之前计算的值
假设我有一个像这样的 DataFrame(或 Series): Value 0 0.5 1 0.8 2 -0.2 3 None 4 None 5 None
python - 冗长的 Pandas 适用
我正在对一个 Pandas 系列进行相对繁重的应用。有什么方法可以返回一些打印反馈，说明每次调用函数时在函数内部进行打印还有多远？最佳答案您可以使用跟踪器包装您的函数。以下两个示例，一个基于完成的
python - 当单元格包含列表时， Pandas 适用
我有一个 DataFrame，其中一列包含列表作为单元格内容，如下所示: import pandas as pd df = pd.DataFrame({ 'col_lists': [[1, 2
python - Pandas 适用，但仅适用于满足条件的行
我想使用 Pandas df.apply 但仅限于某些行作为一个例子，我想做这样的事情，但我的实际问题有点复杂: import pandas as pd import math z = pd.Dat
python - 如果条件适用于后续行和分组依据，则 Pandas 适用
我有以下 Pandas 数据框 id dist ds 0 0 0 0 5 1 0 0 7 2 0 0
java - gradle没有java方法的签名(hashmap.getOrDefault)适用
这发生在我尝试使用 Gradle 构建时。由于字符串是对象，因此似乎没有理由发生此错误: No signature of method: java.util.HashMap.getOrDefault(
javascript - Backbone 示例应用程序和 javascript 适用
您好，有人可以解释为什么在 remaining() 函数中的 Backbone 示例应用程序 ( http://backbonejs.org/examples/todos/index.html ) 中
grails - Grails BootStrap:无方法签名:* .addTo *适用
我有两个域类:用户 class User { String username String password String email Date dateCreated
python - 类型错误 : Positional Arguments with pandas. 适用
问题陈述: 一个 pandas dataframe 列系列，same_group 需要根据两个现有列 row 和 col 的值从 bool 值创建。如果两个值在字典 memberships 中具有相似
android - 适用:iOS 7.1 支持 MKMapItem
apporable 报告以下错误: error: unknown type name 'MKMapItem'; did you mean 'MKMapView'? MKMapItem* destina
python - 使用 API 调用时， throttle Pandas 适用
我有一个带有地址列的大型 DataFrame: data addr 0 0.617964 IN,Krishnagiri,635115 1 0.635428 IN,Chennai
c# - 无 Max() 适用 : Sequence contains no elements
我有一个列表list，里面有这样的项目 ElementA: Number=1, Version=1 ElementB: Number=1, Version=2 ElementC: Number=1,
ios - 适用: 'OBJC_CLASS_$_MKMapView' 和 'OBJC_CLASS_$_MKPinAnnotationView' 的编译失败
我正在编译我的源代码，它只是在没有运行应用程序的情况下终止。这是我得到的日志: Build/android-armeabi-debug/com.app4u.portaldorugby/PortalDo
python - 'numpy.float6 4' object has no attribute ' 适用'
我正在尝试根据另一个单元格的值更改单元格值(颜色“红色”或“绿色”)。我运行以下命令: df.loc[0, 'Colour'] = df.loc[0, 'Count'].apply(lambda x:
scalaz List[StateT].sequence - 找不到参数 n 的隐式值 : scalaz. 适用
我想弄清楚如何使用 StateT结合两个 State基于对我的 Scalaz state monad examples 的评论的状态转换器回答。看来我已经很接近了，但是在尝试申请 sequence
c# - 如果源绑定(bind)适用，如何访问快速访问工具栏命令 `Add to Quick Access Tool`
如果我已经为它绑定(bind)了集合，我该如何添加 RibbonLibrary 默认的快速访问项容器。当我从 UI 添加快速访问工具项时，它会抛出 Operation is not valid whi
haskell - 适用:证明 `pure f <*> x = pure (flip ($)) <*> x <*> pure f`
在我学习期间Typoclassopedia我遇到了这个证明，但我不确定我的证明是否正确。问题是: One might imagine a variant of the interchange law

首页

博学

6Ren·AI

商城

python - inplace=True 不适用于子集数据