gpt4 book ai didi

python - 如何在通过 rpy 将 SPSS 文件(.sav)导入 pandas 时保留标签?

转载 作者:太空狗 更新时间:2023-10-29 21:02:59 26 4
gpt4 key购买 nike

我希望使用 pandas 处理 SPSS 文件 (.sav)。在没有 SPSS 程序的情况下,转换为 .csv 后的典型文件如下所示:

enter image description here

调查前两行的含义(我不知道 SPSS),似乎第一行包含 Label,而第二行包含 VarNames.

enter image description here

当我将文件导入 pandas 时:

import pandas.rpy.common as com

def savtocsv(filename):
w = com.robj.r('foreign::read.spss("%s", to.data.frame=TRUE)' % filename)
w = com.convert_robj(w)
return w

然后做一个head(),第一行(Label)不见了:

enter image description here

如何维护标签?

最佳答案

sav 文件中的标签存储在来自 read.spss 的返回对象的 variable.labels 属性中功能。

您可以通过以下方式获取变量标签:

import pandas.rpy.common as com

def get_labels(filename):
w = com.robj.r('attr(foreign::read.spss("%s"), "variable.labels")' % filename)
w = com.convert_robj(w)
return w

如果您想将标签设置为数据框的列名:

import pandas.rpy.common as com

def savtocsv(filename):
w = com.robj.r('foreign::read.spss("%s", to.data.frame=TRUE)' % filename)
cols = list(com.robj.r("attr")(w, "variable.labels"))
w = com.convert_robj(w)
w.columns = cols
return w

关于python - 如何在通过 rpy 将 SPSS 文件(.sav)导入 pandas 时保留标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36287936/

26 4 0