Python Pandas : fillna/bfill using function-6ren

Python Pandas : fillna/bfill using function

转载作者：行者123 更新时间：2023-12-01 01:58:12

26

4

我已从库存管理系统中检索了多个商品的库存变动情况:

index   itemid    date      sold    received    balance  stock_level
0       123456    30.03.18  -1      0           -1       3
1       123456    04.04.18  -1      0           -1       2
2       123456    09.04.18   0      1            1       3
3       123457    01.04.18   0      1            1       3
4       123457    03.04.18  -1      0           -1       2
5       123457    11.04.18   0      1            1       3

为了执行正确的分析，我创建了一个连续的日期序列

index   itemid    date    sold  received   balance  stock_level
0       123456    28.03.18  0   0           0       nan
1       123456    29.03.18  0   0           0       nan
2       123456    30.03.18  -1  0           -1      3
3       123456    31.03.18  0   0           0       nan
4       123456    01.04.18  0   0           0       nan
5       123456    02.04.18  0   0           0       nan
6       123456    03.04.18  0   0           0       nan
7       123456    04.04.18  -1  0           -1      2
8       123456    05.04.18  0   0           0       nan
9       123456    06.04.18  0   0           0       nan
10      123456    07.04.18  0   0           0       nan
11      123456    08.04.18  0   0           0       nan
12      123456    09.04.18  0   1           1       3
13      123456    10.04.18  0   0           0       nan
14      123456    11.04.18  0   0           0       nan
15      123457    28.03.18  0   0           0       nan
16      123457    29.03.18  0   0           0       nan
17      123457    30.03.18  0   0           0       nan
18      123457    31.03.18  0   0           0       nan
19      123457    01.04.18  0   1           1       3
20      123457    02.04.18  0   0           0       nan
21      123457    03.04.18  -1  0           -1      2
22      123457    04.04.18  0   0           0       nan
23      123457    05.04.18  0   0           0       nan
[...]
28      123457    11.04.18  0   1           1       3

现在，我需要为每个商品 groupby(itemid) 填充 stock 列中的 nan 值。我可以对每个组使用 ffill 来填充第三行的值，但需要根据(第一个非 nan 股票值)-(该索引处的余额值)的函数对每个组进行 bfill。

例如索引 0 的 bfill 应该是(索引 2 处的 stock_level)-(索引 2 处的余额)。

也就是说，我要寻找的结果是

index   itemid    date    sold  received   balance  stock_level
0       123456    28.03.18  0   0           0       4
1       123456    29.03.18  0   0           0       4
2       123456    30.03.18  -1  0           -1      3
3       123456    31.03.18  0   0           0       3
4       123456    01.04.18  0   0           0       3
5       123456    02.04.18  0   0           0       3
6       123456    03.04.18  0   0           0       3
7       123456    04.04.18  -1  0           -1      2
8       123456    05.04.18  0   0           0       2
9       123456    06.04.18  0   0           0       2
10      123456    07.04.18  0   0           0       2
11      123456    08.04.18  0   0           0       2
12      123456    09.04.18  0   1           1       3
13      123456    10.04.18  0   0           0       3
14      123456    11.04.18  0   0           0       3
15      123457    28.03.18  0   0           0       2
16      123457    29.03.18  0   0           0       2
17      123457    30.03.18  0   0           0       2
18      123457    31.03.18  0   0           0       2
19      123457    01.04.18  0   1           1       3
20      123457    02.04.18  0   0           0       3
21      123457    03.04.18  -1  0           -1      2
22      123457    04.04.18  0   0           0       2
23      123457    05.04.18  0   0           0       2
[...]
28      123457    11.04.18  0   1           1       3

如何根据第一个非 nan 值索引处的函数回填每个项目组？

最佳答案

ffill 之后，唯一保留的 NaN 是开头的 NaN。
您需要在此处使用 pd.Series.first_valid_index 以及 ffill 和 fillna 的组合。

i = df.stock_level.first_valid_index()
df.stock_level.ffill().fillna(df.stock_level[i] - df.balance[i])

0     4.0
1     4.0
2     3.0
3     3.0
4     3.0
5     3.0
6     3.0
7     2.0
8     2.0
9     2.0
10    2.0
11    2.0
12    3.0
13    3.0
14    3.0
Name: stock_level, dtype: float64

关于Python Pandas : fillna/bfill using function，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49940329/

26

4

0

文章推荐： javascript - 检查 CKEDITOR 是否已定义

文章推荐： javascript - 检查任何元素是否有文本 - 没有每个循环

文章推荐： asp.net-mvc - 为什么我的浏览器不存储 ASP MVC CORE 2 cookie？

文章推荐： r - 函数将 n 个整数除以 app.大小相同

python - Fillna 如果出现频率最高，则 fillna 为整个列中出现频率最高的值
我有一个 Pandas 数据框 City State 0 Cambridge MA 1 NaN DC 2 Boston MA
python - 如何用列名替换类别的 fillna？
我有一个 pandas 数据框，我想用 'colname_miss' 字符串填充缺失的类别。 def FillCatMissing(df): cols = ['A','B','C']
python - 每列中的变量 fillna()
对于初学者，这里有一些符合我的问题的人工数据: df = pd.DataFrame(np.random.randint(0, 100, size=(vsize, 10)), col
python - fillna 可以接受一个函数还是只接受给定的方法？
fillna可以接受一个函数吗？或者只是“backfill”、“bfill”等方法？ http://pandas.pydata.org/pandas-docs/stable/generated/pan
python - 如何在分组数据框上使用 fillna？
我想在多索引数据帧上使用 fillna，并仅在特定列位于同一索引中时填充该列。下一个索引可能以 n/a 开头，因此我无法在该列上调用 fillna 。组的大小正在变化，因此我无法通过数量来限制功能。
python - fillna 没有给出预期的结果
我正在尝试替换 pandas 数据框中的 NaT。 orders.PAID_AT 0 NaT 1 NaT 2
Python Pandas fillna()
我有一个大型数据框，其值如下: Name A B C D E F G # Coulmns Matt 1 n n n 5 n 5 # rows Jake n n 2
python - 我如何使用类别中值进行 df.fillna
我有一个大约 100 万行的大型数据集，大约有 5000 个缺失坐标(我想用类别“城市”的中值填充它们，但 fillna 正在工作，如何实现它？ city = ['London', 'Paris',
pandas - 如何使用条件执行 pd.fillna()
我正在尝试用 if 条件做一个 fillna Fimport pandas as pd df = pd.DataFrame(data={'a':[1,None,3,None],'b':[4,None,
python - pandas fillna 按顺序一步一步
我有如下数据框 Re_MC,Fi_MC,Fin_id,Res_id, 1,2,3,4 ,7,6,11 11,,31,32 ,,35,38 df1 = pd.read_clipboard(sep
python - 带有递增值的 Pandas fillna
我有一个数据框，其中有一列连续但不相邻的数字和缺失值。我想使用 fillna 函数用前一个非缺失行的增量值填充缺失值。这是一个简化的表格: index my_counter 0 1 1
python - pandas 数据框中的条件 fillna()
我有以下两个数据框 df1和 df2df1: A B C D 1 Nora NaN Japan 2 Neo NaN India 3
python - Pandas fillna 和滚动平均值
我试图填充所有缺失值，直到数据帧结束，但无法这样做。在下面的示例中，我取了最后三个值的平均值。我的代码只填充到 2017-01-10，而我想填充到 2017-01-14。对于 1/14，我想使用 11
python - 最近日期的 Pandas fillna
我有一个关于给定主题的报告数据框。每份报告都有一个分数，受试者在某些日期有分数，但在其他日期没有分数。我想创建一个新的数据框，它只包含每个主题的最新分数。下面是一个 MRE。原始数据框如下所示:
python - Fillna 一次使用多种方法 - pandas
我有一个如下所示的数据框 df = pd.DataFrame({'person_id': [101,101,101,101,202,202,202],
python - 为什么 fillna 不能按预期模式工作
我正在处理一个汽车销售数据集，其中包含以下列:'car'、'price'、'body'、'mileage'、'engV'、'engType'、'registration'、'year'、'model'
python - pandas fillna 不适用于数据集的子集
我想估算 df['box_office_revenue'] 的缺失值中位数由 df['release_date'] == x 指定和df['genre'] == y 。下面是我的中值查找函数。 de
python - Pandas fillna 到空字典
我有一个带有“元数据”列的 Pandas 数据框，该列应包含字典作为值。但是，某些值丢失并设置为 NaN。我希望这是 {}。有时，整个列都丢失了，将其初始化为 {} 也是有问题的。用于添加列 tsp
python - Pandas - 具有行子集的 fillna
我正在尝试在特定条件适用的情况下用 0 填充某些行。我正在尝试: df.loc[:,(df.Available == True) & (df.Intensity.isnull())].Intensit
python - 多索引系列上的 Pandas fillna
带有 NA 的 series_A 由一个 MultiIndex (X, Y) 索引，而要填写的值在 Series_B 中，它由 X 索引。如何有效解决此类问题？例如，这里是series_A: bar

首页

博学

6Ren·AI

商城

Python Pandas : fillna/bfill using function