gpt4 book ai didi

python - 在 Pandas 数据框中用 NaN 替换空列表

转载 作者:太空狗 更新时间:2023-10-29 21:25:37 29 4
gpt4 key购买 nike

我正在尝试用 NaN 值替换我数据中的一些空列表。但是如何在表达式中表示一个空列表呢?

import numpy as np
import pandas as pd
d = pd.DataFrame({'x' : [[1,2,3], [1,2], ["text"], []], 'y' : [1,2,3,4]})
d

x y
0 [1, 2, 3] 1
1 [1, 2] 2
2 [text] 3
3 [] 4



d.loc[d['x'] == [],['x']] = d.loc[d['x'] == [],'x'].apply(lambda x: np.nan)
d

ValueError: Arrays were different lengths: 4 vs 0

而且,我想通过使用 d[d['x'] == ["text"]]ValueError 选择 [text] : Arrays were different lengths: 4 vs 1 错误,但使用 d[d['y'] == 3] 选择 3 是正确的。为什么?

最佳答案

如果您希望用 numpy nan 替换列 x 中的空列表,您可以执行以下操作:

d.x = d.x.apply(lambda y: np.nan if len(y)==0 else y)

如果您想在等于 ['text'] 的行上对数据帧进行子集化,请尝试以下操作:

d[[y==['text'] for y in d.x]]

希望对您有所帮助。

关于python - 在 Pandas 数据框中用 NaN 替换空列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40818924/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com