- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
不知道有没有人知道统计数据分析软件Stata中有一个Python包可以让你把numpy数组/recarrays保存成.dta
格式。这确实会加快我现有系统中的几个步骤。
最佳答案
scikits.statsmodels包包括 Stata 数据文件的阅读器,正如@Sven 所指出的,它部分依赖于 PyDTA。特别是,genfromdta()
将返回一个 ndarray
,例如来自 Python 2.7/statsmodels 0.3.1:
>>> import scikits.statsmodels.api as sm
>>> arr = sm.iolib.genfromdta('/Applications/Stata12/auto.dta')
>>> type(arr)
<type 'numpy.ndarray'>
可以依次使用savetxt()
函数将数组保存为文本文件,在Stata中可以导入。例如,我们可以将上面的导出为
>>> sm.iolib.savetxt('auto.txt', arr, fmt='%2s', delimiter=",")
并在没有字典文件的情况下在 Stata 中读取它,如下所示:
. insheet using auto.txt, clear
我相信在不久的将来应该会添加一个*.dta
阅读器。
关于python - 在 python 中保存 .dta 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7503487/
我正在尝试打开一个 Stata .dta文件被压缩成 winrar在 R. 这是我的代码: library(foreign) setwd("C:/Users/ASUS/Desktop/Data on
我对 stata 比较陌生,我需要将几个 .dta 文件一起 append 到一个数据集中。 我有一个名为 2015 的文件夹,文件如下所示... jan_2015.dta feb_2015.dta
我有一个 10 GB .dta Stata 文件,我正在尝试将其读入 64 位 R 3.3.1。我正在使用大约 130 GB RAM(4 TB HD)的虚拟机,.dta 文件大约有 300 万行和 4
如果某个地方有一个简单的答案,我提前道歉。似乎是这样的事情,但我似乎无法通过搜索 SO 或通过谷歌搜索在帮助文件中找到它。 我现在正在处理一些几 GB 的数据集。它足以容纳我可以访问的集群节点之一的内
我目前正在导入 Stata -使用以下内容将 .dta 文件创建到 SAS 中: proc import datafile='myfile.dta' out=test dbms=dta replace
我正在处理一个大约 3.3 GB 的 Stata .dta 文件,所以它很大但不会太大。我对使用 IPython 很感兴趣,并尝试使用 Pandas 导入 .dta 文件,但发生了一些奇怪的事情。我的
不知道有没有人知道统计数据分析软件Stata中有一个Python包可以让你把numpy数组/recarrays保存成.dta格式。这确实会加快我现有系统中的几个步骤。 最佳答案 scikits.sta
我在数据库中定义了以下表 铺表 店铺编号 店名 所有者 横幅 标题 城市编号 ShopImageId 活跃 城市表 城市编号 城市名 国家/地区 地区编号 国家/地区表 国家/地区 国家名称 地区编号
有没有办法将dta文件转换为csv? 我的计算机上没有安装 Stata 版本,因此我无法执行以下操作: File --> "Save as csv" 最佳答案 令人难以置信的 Python 数据分析库
我正在尝试使用 pandas.read_stata 读取 Python 中的 Stata (.dta) 文件,但出现此错误: ValueError: Version of given Stata fi
我正在尝试使用我的电脑中现有的数据,即 .dta 文件。 我尝试使用以下命令在 R 中打开它: mydata> not a Stata version 5-12 .dta file 任何帮助将不胜感激
我希望通过 Python 将许多 .CSV 文件转换为 .DTA 文件的过程自动化。 .DTA 文件是由 Stata 统计语言处理的文件类型。 但是,我还没有找到解决这个问题的方法。 R 语言有 wr
我的问题。我有一个遗留的 Turbo Pascal 程序,仍在 MS DOS 上运行。原始来源已丢失,我需要处理在 .DTA 文件中找到的信息。 我真的很想从 .Net 访问这些信息,阅读和更新。第一
我已经从 USGS 网站下载了 .dat 格式的空间数据,我也无法在 textedit 中读取 - 它只是说“../ofr041189it03/vat.adf”。我熟悉 STATA、ArcGIS 和
我将 .dta(Stata 文件格式)导入到 R 中,但变量标签似乎没有随变量名称一起导入。 使用foreign::read.dta,我尝试了labels(df),但这只给我变量名;并且 str(df
我正在尝试使用 StataReader 将大型数据集从 Stata 13 导入 pandas。这在 pandas 0.13.1 上运行良好,但在我升级到 0.14.1 后,读取 .dta 文件的能力似
我试图用 Pandas 打开一个 dta 文件,但得到一个 UnicodeDecodeError: >>> import pandas as pd >>> pd.read_stata('/some/s
如何避免将 Stata 数据读入 R 时的编码问题? 我希望读取的数据集是 Stata 12 或 Stata 13 中的 .dta(在 Stata 在版本 14 中引入对 utf-8 的支持之前)。包
我想在 R 中读取 .dta 文件,以便将其转换为 .csv 文件。首先,我尝试使用 foreign 包这样做,但它报告: read.dta(file) 错误:不是 Stata 版本 5-12 .dt
我已使用复制事件将数据复制到 azure blob 容器。我能够使用它来使用 Blob 触发器触发我的 azure 函数。但是,我的要求是调用可以在 azure datafactory 管道中配置的
我是一名优秀的程序员,十分优秀!