- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个大的 CSV 文件,它附带两个元数据描述文件。一个扩展名为 .sas
,另一个扩展名为 .sps
。打开它们,它们描述了 CSV 数据格式和类别。这些文件描述了数据格式和每列可能的类别。例如,值为 1 或 2 的列映射到 yes 和 no。
如何使用这些元数据文件来帮助我读取 CSV 文件?
我可以使用 read_csv 轻松读取它,但这些文件对于自动创建具有可能类别的列很有用。我可以为它们创建一个解析器,但必须有一个包或函数来完成它。也许我没有使用正确的搜索词。
这是 .sas
文件(抱歉,它是葡萄牙语):
proc format;
Value $SG_AREA
CH='Ciךncias Humanas'
CN='Ciךncias da Natureza'
LC='Linguagens e Cףdigos'
MT='Matemבtica';
Value $TP_LINGUA
0='Inglךs'
1='Espanhol';
Value $IN_ITEM_ADAPTADO
0='Nדo'
1='Sim';
DATA WORK.ITENS_2018;
INFILE 'C:\ITENS_PROVA_2018.csv' /*local do arquivo*/
LRECL=33
FIRSTOBS=2
DLM=';'
MISSOVER
DSD ;
INPUT
CO_POSICAO : BEST2.
SG_AREA : $CHAR2.
CO_ITEM : BEST6.
TX_GABARITO : $CHAR1.
CO_HABILIDADE : BEST2.
TX_COR : $CHAR7.
CO_PROVA : BEST3.
TP_LINGUA : $CHAR1.
IN_ITEM_ADAPTADO : $CHAR1. ;
ATTRIB SG_AREA FORMAT = $SG_AREA20.;
ATTRIB TP_LINGUA FORMAT = $TP_LINGUA8.;
ATTRIB IN_ITEM_ADAPTADO FORMAT = $IN_ITEM_ADAPTADO3.;
LABEL
CO_POSICAO='Posiחדo do Item na Prova'
SG_AREA='ֱrea de Conhecimento do Item'
CO_ITEM='Cףdigo do Item'
TX_GABARITO='Gabarito do Item'
CO_HABILIDADE='Habilidade do Item'
TX_COR='Cor da Prova'
CO_PROVA='Identificador da Prova'
TP_LINGUA='Lםngua Estrangeira '
IN_ITEM_ADAPTADO='Item pertencente א prova adaptada para Ledor'
;RUN;
在这里您可以看到等效的 .sps
文件:
GET DATA
/TYPE=TXT
/FILE= "C:\ITENS_PROVA_2018.csv" /*local do arquivo*/
/DELCASE=LINE
/DELIMITERS=";"
/ARRANGEMENT=DELIMITED
/FIRSTCASE=2
/IMPORTCASE= ALL
/VARIABLES=
CO_POSICAO F2.0
SG_AREA A2
CO_ITEM F6.0
TX_GABARITO A1
CO_HABILIDADE F2.0
TX_COR A7
CO_PROVA F3.0
TP_LINGUA A1
IN_ITEM_ADAPTADO A1.
CACHE.
EXECUTE.
DATASET NAME ITENS_18 WINDOW=FRONT.
VARIABLE LABELS
CO_POSICAO Posiחדo do Item na Prova
SG_AREA ֱrea de Conhecimento do Item
CO_ITEM Cףdigo do Item
TX_GABARITO Gabarito do Item
CO_HABILIDADE Habilidade do Item
TX_COR Cor da Prova
CO_PROVA Identificador da Prova
TP_LINGUA Lםngua Estrangeira
IN_ITEM_ADAPTADO Item pertencente א prova adaptada para Ledor.
VALUE LABELS
SG_AREA
"CH" Ciךncias Humanas
"CN" Ciךncias da Natureza
"LC" Linguagens e Cףdigos
"MT" Matemבtica
/TP_LINGUA
0 Inglךs
1 Espanhol
/IN_ITEM_ADAPTADO
0 Nדo
1 Sim.
您可以看到它们描述了每列的元数据。
最佳答案
.sas 是 program file extension用于 SAS,并且设计为通过 SAS 使用。它本质上是一个充当字典文件的命令文件。
.sps 是 SPSS 的程序文件扩展名,旨在通过 SPSS 使用。它本质上是一个充当字典文件的命令文件。我也想在这里提供一个方便的链接,但 SPSS 是 IBM 产品,他们的文档是一片 hell 般的风景,任何人都不应踏足。
尽管如此,你想要做的事情应该是可能的。 Pandas 本身是不够的,因为它没有内置功能来解决这些情况。 Pandas 对 SAS 的支持仅扩展到 .sas7bdat 数据文件,对 SPSS 的支持仅扩展到 .sav 数据文件。
Python(和 Pandas)可以读取 .sas 和 .sps 扩展名,因为它们是纯文本文件,但实际上无法对它们执行任何操作。
<小时/>您可以通过以下两条途径来获得您想要的东西。
1) 在试用版上安装 SAS 或 SPSS,用它来读取数据,然后以替代格式导出。
2) 安装并尝试使用 Pandas 的 pyreadstat 扩展。
听起来 pandas 框架是您的首选,要使其发挥作用,您需要扩展它的功能。在本例中,使用 pyreadstat扩大。它旨在处理 SAS 和 SPSS 数据文件,并且处理它们的效率比 pandas 本身要高得多。该解决方案有一个警告。
Pyreadstat 本身就是 ReadStat 的转换。引用 pyreadstat 自述文件:
This module is a wrapper around the excellent Readstat C library by Evan Miller.
Readstat is the library used in the back of the R library Haven,
meaning pyreadstat is a python equivalent to R Haven.
如果您只查看 pyreadstat 文件,您通常不会发现任何涉及 .sas 或 .sps 或字典文件的内容。相反,您需要查看 ReadStat 的自述文件 here 。它有一个章节专门介绍了此类情况。
到目前为止,我还没有测试 pyreadstat 中字典文件存在的 ReadStat 命令和函数,因此这可能不起作用。
如果您尝试此解决方案但失败,请跟进该线程,我将帮助您排除故障。
关于python - 如何使用 .SAS 或 SPS 元数据文件将 CSV 读取为 Pandas 数据帧?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58534190/
我得到了很多作为 .dat 到达的数据集带有用于转换为 SPSS 的语法文件的文件 ( .sps )。我是 R 用户,所以我需要转换 .dat文件变成 .sav R 可以读取。 过去,我使用 PSPP
大家好,我一直在试图找出如何从 SPS 最终单位计算宽度和高度。我有具有这些参数的 H264 视频 h264 (High), yuvj420p(pc), 1280x720 [SAR 1:1 DAR 1
我有一个提供 H264 编码帧的设备。那些我想使用 LIVE555 通过网络传输的。 问题:这些帧不包括 SPS 和 PPS NAL 单元。但是,我可以访问一个函数,该函数在设备对第一帧进行编码后为我
我有两个视频流单元能够流式传输实时视频输入: AXIS Q7424-R 视频编码器 EPIPHAN VGADVI 广播器 99460 - 我正在使用 gstreamer 在运行 Linux 的客户端终
我正在尝试初始化一个 FFMPEG H264 编解码器上下文,用 SPS 帧填充额外数据字段,如下所示: #include #include int main() { const ch
我正在使用 gstreamer 摄取不同类型的安全摄像头 RTSP 流。在大多数情况下,我使用与此类似的管道 gst-launch-1.0 rtspsrc location=rtsp:// proto
我编写了一个 RTP 服务器来接收通过命令 ffmpeg -i test.mp4 rtp rtp://ip:port(客户端)发送的 RTP 数据包,服务器可以获得最终类型 24(STAP-A)。 我
我使用新 API 将图像从相机推送到 videoToolBox 编码器并从编码器回调中获取编码的 CMSampleBufferRef 我需要这些 sps 和 pts 用于 CMVideoFormatD
我正在尝试使用 MediaCodec NDK 解码具有非默认比色法的视频。我将 SPS 和 PPS 分别提供给 csd-0 和 csd-1 缓冲区,但这些信息似乎不会影响解码视频的外观。 首先,我初始
谁能给我指点文档,帮助我获得 iPhone 的正确 SPS 和 PPS 值。 最佳答案 问题有点不清楚... Picture Parameter Set 描述在最新的ITU-T release 7.3
我正在尝试将一个大文件 (1 GB) 从代码上传到 SharePoint 2013 on prem。我关注了this tutorial ,我从 NuGet 下载包“Microsoft.SharePoi
我对图像进行编码以供视频捕获器使用,并通过 ffmpeg 将其编码为 h264 并发送到我的客户端 pc 。 我的客户端电脑解码并显示它。它可以很好地解码和显示。 但我将这些压缩图像保存在一个文件中。
我使用 ffmpeg 和 libx264 对我的视频进行编码,当我打印 AVPacket 数据时,我发现有些东西只存在于第一个 IDR 之前。有人可以告诉我那是什么,谢谢。 0 0 1 6 5 ff
对于我的硬件解码器,我需要了解有关视频编解码器(如 h264)的其他编解码器规范?如何使用 libav ffmpeg 提取低级编解码器信息? 我需要的数据:https://www.ffmpeg.org
我正在尝试在 h.264 中编码视频,当使用 Apples HTTP Live Streaming 工具拆分时,媒体文件分段器将通过媒体文件验证器我在拆分的 MPEG-TS 文件上遇到两个错误 WAR
我使用英特尔硬件 MFT 将 NV12 帧编码为 H264 流,并使用 Live555 通过 LAN 上的 RTP 流式传输编码帧,并在另一端设置 ffplay 来解码和显示相同的帧。该设置与软件编码
我有一个来自 IP 摄像机的原始 H.264 流,它被打包在 RTP 帧中。我想将原始 H.264 数据放入一个文件中,以便我可以使用 ffmpeg 对其进行转换。 因此,当我想将数据写入原始 H.2
我需要将输出表导出为 *.sps(SPSS 语法)格式。 我使用的代码 80% 的时间都有效: Sub Print_CM_to_sps() Dim FSO As Object Set FSO =
我有一个大的 CSV 文件,它附带两个元数据描述文件。一个扩展名为 .sas,另一个扩展名为 .sps。打开它们,它们描述了 CSV 数据格式和类别。这些文件描述了数据格式和每列可能的类别。例如,值为
我有一台 AXIS IP 摄像机 (M1054),它通过 RTSP 发送 H264/RTP 流。 不幸的是,他们根本不发送 SPS 和 PPS NALU,他们只传输(分段的)编解码器切片。 我正在尝试
我是一名优秀的程序员,十分优秀!