- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个 DataFrame,我按 Internal Score
和 Issue Date
(按季度)分组。然后我想创建一个统计表,其中包括贷款数量的累计计数(由 Loan #
的不同计数表示)、贷款金额的累计总和以及 实际损失
和未偿本金
。累计总和和累计计数应包括截至该特定时间点的第一个日期的快照。 (即2015年第一季度到2015年第二季度的累计总和,然后是2015年第一季度到2015年第三季度,然后是2015年第一季度到2015年第四季度等)
示例数据集:
Loan # Amount Issue Date TU Status List Internal Score Last Actual Paid \
0 57144 3337.76 2017-04-03 B A 0.0
1 57145 5536.46 2017-04-03 B C 0.0
2 57160 3443.91 2017-04-03 B B 0.0
3 57161 1162.79 2017-04-03 B B 0.0
4 57162 3845.98 2017-04-03 B B 0.0
5 57163 3441.50 2017-04-03 B B 0.0
6 57164 2039.96 2017-04-03 B C 0.0
7 57165 4427.53 2017-04-03 B A 0.0
8 57166 4427.53 2017-04-03 B A 0.0
9 57167 1617.77 2017-04-03 B B 0.0
Outstanding-Principal Actual Loss
0 3337.76 0.0
1 5536.46 0.0
2 3443.91 0.0
3 1162.79 0.0
4 3845.98 0.0
5 3441.50 0.0
6 2039.96 0.0
7 4427.53 0.0
8 4427.53 0.0
9 1617.77 0.0
我试过这样的:
container = []
for i in ['A', 'B', 'C', 'D']:
subdf = df[df['Internal Score'].str.contains(i)]
# Calculate Quarterly Vintages
subdf.set_index('Issue Date', inplace=True)
df2 = subdf.groupby(pd.TimeGrouper('Q')).agg({'Outstanding-Principal': np.sum, 'Actual Loss': np.sum,
'Amount': cumsum, 'Loan #': cumcount})
df2['Internal Score'] = i
container.append(df2)
ddf = pd.concat(container)
最佳答案
您可以先使用groupby
,然后再应用cumsum
。
我修改了您的虚拟数据,同时将日期更改为跨季度以使您的示例更加清晰:
print(df)
Loan # Amount Issue Date Internal Score Outstanding Principal Actual Loss
0 57144 3337.76 2017-04-03 A 3337.76 0.0
1 57145 5536.46 2017-04-03 C 5536.46 0.0
2 57160 3443.91 2017-04-03 B 3443.91 0.0
3 57161 1162.79 2017-04-03 B 1162.79 0.0
4 57162 3845.98 2017-04-03 B 3845.98 0.0
5 57163 3441.50 2017-07-03 B 3441.50 0.0
6 57164 2039.96 2017-07-03 C 2039.96 0.0
7 57165 4427.53 2017-07-03 A 4427.53 0.0
8 57166 4427.53 2017-07-03 A 4427.53 0.0
9 57167 1617.77 2017-07-03 B 1617.77 0.0
首先,创建一个包含标识给定时间戳的季度和年份的键的列:
# in case it is not a timestamp already
df["Issue Date"] = pd.to_datetime(df["Issue Date"])
dt = df["Issue Date"].dt
df["Quarter"] = dt.strftime("%Y").str.cat(dt.quarter.astype(str), " Q")
print(df["Quarter"])
0 2017 Q2
1 2017 Q2
2 2017 Q2
3 2017 Q2
4 2017 Q2
5 2017 Q3
6 2017 Q3
7 2017 Q3
8 2017 Q3
9 2017 Q3
Name: Quarter, dtype: object
现在,聚合:
funcs = {'Outstanding Principal': np.sum,
'Actual Loss': np.sum,
'Amount': np.sum,
'Loan #': len}
result = df.groupby(['Internal Score', "Quarter"]).agg(funcs)
print(result)
Outstanding Principal Amount Actual Loss Loan #
Internal Score Quarter
A 2017 Q2 3337.76 3337.76 0.0 1
2017 Q3 8855.06 8855.06 0.0 2
B 2017 Q2 8452.68 8452.68 0.0 3
2017 Q3 5059.27 5059.27 0.0 2
C 2017 Q2 5536.46 5536.46 0.0 1
2017 Q3 2039.96 2039.96 0.0 1
最后使用 transform
和 cumsum
:
cum_cols = ["Amount", "Loan #"]
cumsums = result.groupby(level="Internal Score")[cum_cols].transform(lambda x: x.cumsum())
result.loc[:, cum_cols] = cumsums
print(result)
Outstanding Principal Amount Actual Loss Loan #
Internal Score Quarter
A 2017 Q2 3337.76 3337.76 0.0 1
2017 Q3 8855.06 12192.82 0.0 3
B 2017 Q2 8452.68 8452.68 0.0 3
2017 Q3 5059.27 13511.95 0.0 5
C 2017 Q2 5536.46 5536.46 0.0 1
2017 Q3 2039.96 7576.42 0.0 2
关于 python / Pandas : How to combine cumsum and cumcount with agg function?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43282471/
main.cpp #include "Primes.h" #include int main(){ std::string choose; int num1, num2; w
似乎函数 qwertyInches() 应该可以工作但是当我在 main() 中调用它时它给了我 [Error] called object 'qwertyInches' is not a funct
我无法理解 C++ 语法的工作原理。 #include using namespace std; class Accumulator{ private: int value; public:
在 类中声明 函数成员时,我们可以同时执行这两种操作; Function first; Function() second; 它们之间有什么区别? 最佳答案 Function 代表任意函数: void
“colonna”怎么可能是一个简单的字符串: $('td.' + colonna).css('background-color','#ffddaa'); 可以正确突出显示有趣单元格的背景,并且: $
我正在尝试将网页中的动态参数中继到函数中,然后函数将它们传递给函数内部的调用。比如下面这个简化的代码片段,现在这样,直接传入参数是没有问题的。但是,如何在不为每个可能的 colorbox 参数设置 s
C++ 中是否有一种模式允许您返回一个函数,它返回一个函数本身。例如 std::function func = ...; do { func = func(); } while (func);
我正在将 Windows 程序集移植到 Linux。我有一些代码要移植。我实际上是 linux 中 C 的新手。我知道 C 基础知识是一样的! typedef struct sReader {
我一直在寻找一个很好的解释,所以我很清楚。示例: this.onDeleteHandler(index)}/> 对比 对比 this.nameChangedhandler(event, perso
function(){}.__proto__ === Function.prototype 和 Function.prototype === function(){}.__proto__ 得到不同的结
https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Function 据说 Propert
VBA 中的函数没有特殊类型。我很难理解如何在 Excel VBA 中将函数作为参数添加到函数中。 我想要完成的是这样的事情: function f(g as function, x as strin
所以我正在尝试制作一个包(我没有在下面包含我的 roxygen2 header ): 我有这个功能: date_from_text % dplyr::mutate(!!name := lubr
尝试从 std::function 派生一个类,对于初学者来说,继承构造函数。这是我的猜测: #include #include using namespace std; template cla
我正在尝试编写一个返回另一个函数的函数。我的目标是编写一个函数,它接受一个对象并返回另一个函数“search”。当我使用键调用搜索函数时,我想从第一个函数中给定的对象返回该键的值。 propertyO
我非常清楚函数式编程技术和命令式编程技术之间的区别。但是现在有一种普遍的趋势是谈论“函数式语言”,这确实让我感到困惑。 当然,像 Haskell 这样的一些语言比 C 等其他语言更欢迎函数式编程。但即
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 8 年前。 Improv
我在stackoverflow上查过很多类似的问题,比如call.call 1 , call.call 2 ,但我是新人,无法发表任何评论。我希望我能找到关于 JavaScript 解释器如何执行这些
向 Twilio 发送 SMS 时,Twilio 会向指定的 URL 发送多个请求,以通过 Webhook 提供该 SMS 传送的状态。我想让这个回调异步,所以我开发了一个 Cloud Functio
作为 IaC 的一部分,A 功能应用 ,让我们将其命名为 FuncAppX 是使用 Terraform 部署的,它有一个内置函数。 我需要使用 Terraform 在函数应用程序中访问相同函数的 Ur
我是一名优秀的程序员,十分优秀!