作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是我第一次使用 Jupyter Notebook 分析调查数据(.sav 文件),我想以一种显示元数据的方式阅读它,以便我可以将答案与问题联系起来。我在这个领域完全是新手,所以非常感谢您的帮助!
import pandas as pd
import pyreadstat
df, meta = pyreadstat.read_sav('./SimData/survey_1.sav')
type(df)
type(meta)
df.head()
如果我需要额外的步骤才能看到元数据,请 lmk!
最佳答案
元对象包含您要查找的元数据。最有用的属性可能是:
print(meta.column_names_to_labels)
print(meta.variable_value_labels)
例如,如果您有一个值为 1 和 2 的“性别”列,您可以得到:{“性别”:{1:“男”,2:“女”}}这意味着值 1 是男性,2 是女性。如果您传递参数 apply_value_formats ,您可以从头开始获取这些标签:
df, meta = pyreadstat.read_sav('survey.sav', apply_value_formats=True)
您还可以随时使用 pyreadstat.set_value_labels 将这些值格式应用于您的数据框,它会返回带有标签的数据框副本:
df_copy = pyreadstat.set_value_labels(df, meta)
df, meta = pyreadstat.read_sav("survey.sav", user_missing=True)
print(meta.missing_ranges)
print(meta.variable_value_labels)
这些是对您的案例有用的潜在信息片段,不一定所有这些片段都会出现在您的数据集中。
更多信息在这里:https://ofajardo.github.io/pyreadstat_documentation/_build/html/index.html
关于python - 如何在 Python 中读取 SPSS aka (.sav),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62962795/
我是一名优秀的程序员,十分优秀!