- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的公司正在从 SAS 转向其他工具,Python 是首选工具。我有很多在 SAS 中运行的遗留代码需要移植过来,有些事情比其他事情更容易做。
我使用的许多数据集都需要转换,以便每个唯一 ID 列有一行,为此我广泛使用了此处的 %transpose 宏:https://raw.githubusercontent.com/art297/transpose/master/transpose.sas。从本质上讲,它允许我进行单个函数调用,我在其中传递输入数据集名称、输出数据集名称、id 列和要旋转的列以获得我想要的输出。
我一直在努力使用 Python 复制功能,我已经非常接近了,但我现在卡住了。
这是一个例子:
import pandas as pd
cust = ['CUST123', 'CUST123', 'CUST123', 'CUST456', 'CUST456']
start_date = ['01/01/2021','01/02/2021','01/03/2021','01/04/2021','01/05/2021']
end_date = ['01/11/2021','01/12/2021','01/13/2021','01/14/2021','01/15/2021']
code = ['ABC123','DEF456','GHI789','JKL123','MNO456']
df = pd.DataFrame(list(zip(cust, start_date, end_date, code )), columns = ['cust', 'start_date', 'end_date', 'code'])
df['start_date'] = pd.to_datetime(df['start_date'])
df['end_date'] = pd.to_datetime(df['end_date'])
这给了我一个看起来像这样的示例数据集:
cust start_date end_date code
0 CUST123 2021-01-01 2021-01-11 ABC123
1 CUST123 2021-01-02 2021-01-12 DEF456
2 CUST123 2021-01-03 2021-01-13 GHI789
3 CUST456 2021-01-04 2021-01-14 JKL123
4 CUST456 2021-01-05 2021-01-15 MNO456
在 SAS 中我会使用:
%transpose(data=INPUT,
out=OUTPUT,
by=cust,
delimiter=_,
var=start_date end_date code);
将其作为我想要的输出:
cust start_date_1 end_date_1 code_1 start_date_2 end_date_2 code_2 start_date_3 end_date_3 code_3
0 CUST123 2021-01-01 2021-01-11 ABC123 2021-01-02 2021-01-12 DEF456 2021-01-03 2021-01-13 GHI789
1 CUST456 2021-01-04 2021-01-14 JKL123 2021-01-05 2021-01-15 MNO456
到目前为止,我已经使用了这段代码:
df['idx'] = df.groupby('cust').cumcount()+1
df = df.pivot_table(index='cust', columns='idx', values=['start_date', 'end_date', 'code'], aggfunc='first')
df = df.sort_index(axis=1, level=1)
df.columns = [f'{x}_{y}' for x, y in df.columns]
df.reset_index()
然而这会产生:
cust code_1 end_date_1 start_date_1 code_2 end_date_2 start_date_2 code_3 end_date_3 start_date_3
0 CUST123 ABC123 2021-01-11 2021-01-01 DEF456 2021-01-12 2021-01-02 GHI789 2021-01-13 2021-01-03
1 CUST456 JKL123 2021-01-14 2021-01-04 MNO456 2021-01-15 2021-01-05
这与我所追求的非常接近。唯一的问题是 SAS 宏按照我在函数调用中指定的顺序保留旋转列。无论我指定什么,Python 代码都会按字母顺序排列它们,因为它就是这样工作的。
我可以插入一个 for 循环,在我的数据透视字段前添加 [a...b...c...etc...],然后对它们进行排序和旋转,然后遍历列标题以将它们更改为包含除了第一个角色之外的所有内容,但我无法想象这是最好的方法。这很丑陋,而且我几乎可以肯定还有一些我在所有搜索中都没有找到的其他方法更可取。
我是否坚持使用上述丑陋的方法,或者我是否正确认为有更好的方法?
最佳答案
在 sort_index
函数中传递 sort_remaining=False
,以保持您的列不变。
result = (
df.assign(idx=df.groupby("cust").cumcount() + 1)
.pivot("cust", "idx")
.sort_index(axis="columns", level=1, sort_remaining=False)
)
result.columns = result.columns.map(lambda x: f"{x[0]}_{x[1]}")
关于python - 在 Python 中复制 %transpose SAS 宏,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65693995/
如何在 Excel 中编写可以在我将打开的任何 Excel 文档上工作(使用快捷方式运行)的宏? 这可能吗? 最佳答案 您需要将宏添加到 Personal.xlsb 以使它们可用于所有 excel 文
我正在研究 problem #74在4clojure.com,我的解决方案如下: (defn FPS [s] (->> (map read-string (re-seq #"[0-9]+"
我还没有完全理解Clojure 箭头宏thread-first -> 和thread-last 宏->> 之间的区别。在阅读 https://clojure.org/guides/threading_
我想将一些调试输出语句插入到大型 C 代码库中。这些调试输出语句将由编译器选项开关控制。 调试输出语句如下所示: #ifdef DEBUG_FLAG Print(someSymbol) #endif
我正在通过宏将代码注入(inject)到 C++ 类中。有没有办法根据访问修饰符的上下文来做到这一点?有点像 #if (we_are_in_public_context) INJECT_PUBLIC_
这应该与 memoize 类似,但有很大不同。虽然 memoize 应该与纯函数一起使用,但它通常对加速 IO 相关函数很有用。 我正在寻找的函数/宏应该表现得像高阶函数。它产生的功能应该: 第一次调
对于下面的代码: let services: [MyServices] = [ MyService(), #if DEBUG DebugService(), #endi
假设我有以下文本文件 name: John Doe description: My name is John Doe and I'm really good at vim! name: John Do
在创建 Excel 宏方面需要帮助。我有一个 Excel 工作表。Excel 工作表不一致。我打算使它统一和结构化。 例如。 A B C
我正在 excel 中设置一个宏,以便在更新单元格时自动发送电子邮件。是否可以在电子邮件正文中包含单元格的内容?例如,如果单元格 G7 已更新,请在电子邮件中包含单元格 B7 的内容?单元格行将是相同
我创建了一个简单的 Excel 工作表。 这是我的宏代码: Sub MyMacro() Sheets("Sheet1").Select A$ = Cells(1, 1) Msg
在 Excel 的 VB 宏中,如何删除所有出现的以某个字符串开头的单词? 例如: 字符串内容为:xxxx $AUD543.43 yyyy 我想搜索以 $AUD 开头的字符串中的任何内容并删除下一个空
我是 Excel 宏的新手.. 谁能告诉我这个宏是做什么的? Sub People_Add_Document() prow = ActiveCell.row num = Cells(p
我对 Excel 中的 VBA 和宏非常陌生。我有一个非常大的 Excel 电子表格,其中 A 列保存日期。我正在尝试删除值小于某个日期的行,这就是我到现在为止的想法。 Sub DELETEDATE(
我在 Excel 2003 中有一个 VBA 对象,当通过流数据获得某些值时,它会触发三个简单的宏。它运行良好。我想打开一个重复的工作表,但具有不同的流数据,并在各自的工作表上触发宏。它现在可以使用,
下面的宏有什么问题?我只想评估一个选项卡中的一个单元格是否大于另一个选项卡中的另一个单元格。然后消息框: Sub Comhouse() If Worksheets("(2.2) TRA works
需要一个简单的 excel 宏的帮助。我在第 1 列 X1 到 X20 中有数据。我想自动将此信息粘贴到 A 列,然后当我更新 X 列中的数字时,我想将此信息粘贴到 B 列,然后再粘贴到 C 列...
我找到了以下代码,效果很好;但是,我必须手动更改月份,以便它转到第二个工作簿的右侧工作表。由于工作表以月为单位,我怎样才能使其自动更改为当月? Sub AlarmSheet() Dim wkb As
很难说出这里问的是什么。这个问题是模棱两可的、模糊的、不完整的、过于宽泛的或修辞的,无法以目前的形式得到合理的回答。如需帮助澄清这个问题以便重新打开它,visit the help center .
我的公司只使用 MS Office 2003 产品,所以我必须坚持下去。由于我的工作性质,我需要使用很多“复制和粘贴”功能。源数据主要来自网站,我将数据粘贴到 Excel 中的单元格中。问题是剪贴板保
我是一名优秀的程序员,十分优秀!