gpt4 book ai didi

python - 将 pandas Series 作为列添加到 DataFrame 时出现 Wild NaN

转载 作者:太空宇宙 更新时间:2023-11-03 16:02:52 24 4
gpt4 key购买 nike

我与一个我无法理解的奇怪错误作斗争。也许这是我忽略的一些非常基本的东西。代码如下:

df = pd.DataFrame(
some_numpy_array,
columns=[i for i in range(N)])

df.shape
(57058, 20)

some_pd_series.shape
(57058,)

df["Text"] = some_pd_series

sum(some_pd_series.isnull())
0

sum(df["Text"].isnull())
21137

df["Text"] 应该与 some_pd_series 完全相同,对吧?那么这些 NaN 突然从何而来?

最佳答案

感谢@EdChum 评论,我发现问题是由索引不匹配引起的。发生这种情况是因为之前我从 some_pd_series 中删除了重复项,这导致其索引中出现“漏洞”。

解决此问题的可能方法包括:

  1. some_pd_series.index = df.index
  2. some_pd_series.reset_index(drop=True, inplace=True)

关于python - 将 pandas Series 作为列添加到 DataFrame 时出现 Wild NaN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40154147/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com