gpt4 book ai didi

python - 如何在从 pandas 数据帧保存 SPSS 系统(sav)文件时将系统缺失值从 nan 重新编码为空白空间?

转载 作者:太空宇宙 更新时间:2023-11-03 16:36:23 25 4
gpt4 key购买 nike

我使用 savReaderWriter 模块通过以下代码从 python pandas 数据帧保存 SPSS 文件:

import savReaderWriter as srw
savFileName = 'Outfile name.sav'

records = map(list, df.values)

varNames = list(df.columns)
varTypes = {}

for n, values in enumerate(records[0]):
varName = varNames[n]
if df.dtypes[n] == 'float64':
varTypes[varName] = 0
else:
varTypes[varName] = 255

with srw.SavWriter(savFileName, varNames, varTypes, ioUtf8=True) as writer:
writer.writerows(records)

问题在于 SPSS 文件中的空字符串变量具有“nan”值。在文档中,savWriter 的默认选项是 missingValues=None,但是将“None”更改为 '' 或任何其他字符串都不起作用。使用空字符串而不是 nan 的解决方案是什么?

提前非常感谢

最佳答案

我想如果你想将“nan”值表示为空字符串,最好的方法是在源 df 中替换它们

df.fillna('')

然后保存。

附注但请注意 SPSS 用于处理缺失数据的方法。这些设置位于文件的 header 中。

关于python - 如何在从 pandas 数据帧保存 SPSS 系统(sav)文件时将系统缺失值从 nan 重新编码为空白空间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37168850/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com