gpt4 book ai didi

python - 在存在 NaN 的情况下将 pandas 列拆分为新列

转载 作者:太空宇宙 更新时间:2023-11-03 14:20:40 24 4
gpt4 key购买 nike

我有一个 pandas DataFrame,其中包含一个字符串列,需要拆分成两个单独的列。使用 tolist 的答案是我在 SO 上从 this 找到的问题就像一个魅力,除非我的专栏包含 NaN。下面的摘录描述了困难:

import pandas as pd
import numpy as np

# Example DataFrame
df = pd.DataFrame([[25.0, '34.2/ 18.1', 'one'],
[32.6, '28.6/ 17.9', 'two'],
[12.5, '30.1/ 17.6', 'three']], columns=['A', 'B', 'C'])
df2 = df.copy()

# This method works when all data are present
df['D'] = pd.DataFrame(df['B'].str.split('/').tolist())[1]

# However, when there are NaNs:
df2['B'][0] = np.nan

# This line fails
df2['D'] = pd.DataFrame(df2['B'].str.split('/').tolist())[1]

它给了我一个 KeyError,因为中间 DataFrame 只有一列,表明去列表和返回列表的麻烦不再完成任何事情:

               0
0 NaN
1 [28.6, 17.9]
2 [30.1, 17.6]

我尝试先通过 pd.DataFrame(df2['B'].str.split('/').dropna().tolist()) 删除 NaN,但随后我丢失了索引...我需要将 NaN 保持在索引 0。我还想过在创建中间 DataFrame 时以某种方式复制 NaN 以强制两列,但我没有运气。

这就是我需要的 df2 数据:

      A           B      C     D
0 25.0 NaN one NaN
1 32.6 28.6/ 17.9 two 17.9
2 12.5 30.1/ 17.6 three 17.6

有没有办法不使用列表作为中介来做到这一点?或者以某种方式处理 NaN?

最佳答案

如果您在拆分后再次使用 str 访问器(而不是使用 tolist() 并制作另一个 DataFrame),则可以继续使用您的方法:

>>> df2['D'] = df2['B'].str.split('/').str[-1]
>>> df2
A B C D
0 25.0 NaN one NaN
1 32.6 28.6/ 17.9 two 17.9
2 12.5 30.1/ 17.6 three 17.6

如果索引不存在,则返回 NaN,而不是引发错误。

关于python - 在存在 NaN 的情况下将 pandas 列拆分为新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28374981/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com