- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
这是我拥有的一个非常小的时间序列数据子集:
Date Client Value
01-Sep-2016T ABC 160000
02-Sep-2016T ABC 150000
03-Sep-2016T ABC 190000
04-Sep-2016T ABC 200000
05-Sep-2016T ABC 140000
06-Sep-2016T ABC 120000
07-Sep-2016T ABC 185000
08-Sep-2016T ABC 119000
01-Sep-2016T DEF 200
02-Sep-2016T DEF 100
03-Sep-2016T DEF 150
04-Sep-2016T DEF 10
05-Sep-2016T DEF 5
06-Sep-2016T DEF 160
07-Sep-2016T DEF 150
08-Sep-2016T DEF 3
我创建了一个数据框,如下:
dataFrame = pd.read_csv('test_data_02.csv')
然后,我尝试添加 Value
列的移动平均值,如下所示:
dataFrame['Value_MovingAverage'] = dataFrame['Value'].rolling(window=3, min_periods=1, center=False).mean()
然后,当我调用 dataFrame.head(20)
查看生成的 ValueMovingAverage
列时,我看到:
Date Client Value Value_MovingAverage
0 01-Sep ABC 160000 160000.000000
1 02-Sep ABC 150000 155000.000000
2 03-Sep ABC 190000 166666.666667
3 04-Sep ABC 200000 180000.000000
4 05-Sep ABC 140000 176666.666667
5 06-Sep ABC 120000 153333.333333
6 07-Sep ABC 185000 148333.333333
7 08-Sep ABC 119000 141333.333333
8 01-Sep DEF 200 **101400.000000**
9 02-Sep DEF 100 39766.666667
10 03-Sep DEF 150 150.000000
11 04-Sep DEF 10 86.666667
12 05-Sep DEF 5 55.000000
13 06-Sep DEF 160 58.333333
14 07-Sep DEF 150 105.000000
15 08-Sep DEF 3 104.333333
正如我们所见,“DEF”客户的 Value_MovingAverage
受到前面两个“ABC”客户的非常高的值的影响。例如,索引 #8 显示“DEF”的 3 天移动平均值为 101400.000000,因为它使用以下值:
185,000119,000200
平均 --> 101400
我正在尝试让索引 # 8 的 Value_MovingAverage 不显示任何内容(因为客户端“ABC”没有前面的值),让索引 #14 显示 Value_MovingAverage 58.33333,因为它引用了以下内容:
160105个平均值 --> 58.33333
我的问题是:
1) 在计算“DEF”客户端(对于整个数据框中的所有其他“客户端”值等等)的移动平均值时,如何告诉 Pandas 忽略“ABC”的值?请注意,我有数百个“客户”值,因此创建不同的框架(每个“客户”一个)然后应用滚动平均值并不是真正的选择。
2) 如何将移动平均值偏移一行,以便给定行数的平均值不考虑自身?
提前致谢!
最佳答案
更新:
In [41]: df['new'] = (df.groupby('Client', as_index=False)
....: .rolling(3, min_periods=1, center=False)
....: .Value.mean()
....: .reset_index(drop=True))
In [42]: df
Out[42]:
Date Client Value new
0 01-Sep-2016T ABC 160000 160000.000000
1 02-Sep-2016T ABC 150000 155000.000000
2 03-Sep-2016T ABC 190000 166666.666667
3 04-Sep-2016T ABC 200000 180000.000000
4 05-Sep-2016T ABC 140000 176666.666667
5 06-Sep-2016T ABC 120000 153333.333333
6 07-Sep-2016T ABC 185000 148333.333333
7 08-Sep-2016T ABC 119000 141333.333333
8 01-Sep-2016T DEF 200 200.000000
9 02-Sep-2016T DEF 100 150.000000
10 03-Sep-2016T DEF 150 150.000000
11 04-Sep-2016T DEF 10 86.666667
12 05-Sep-2016T DEF 5 55.000000
13 06-Sep-2016T DEF 160 58.333333
14 07-Sep-2016T DEF 150 105.000000
15 08-Sep-2016T DEF 3 104.333333
旧答案:
In [28]: df.groupby('Client').rolling(3, min_periods=1, center=False).mean()
Out[28]:
Date Client Value
Client
ABC 0 01-Sep-2016T ABC 160000.000000
1 02-Sep-2016T ABC 155000.000000
2 03-Sep-2016T ABC 166666.666667
3 04-Sep-2016T ABC 180000.000000
4 05-Sep-2016T ABC 176666.666667
5 06-Sep-2016T ABC 153333.333333
6 07-Sep-2016T ABC 148333.333333
7 08-Sep-2016T ABC 141333.333333
DEF 8 01-Sep-2016T DEF 200.000000
9 02-Sep-2016T DEF 150.000000
10 03-Sep-2016T DEF 150.000000
11 04-Sep-2016T DEF 86.666667
12 05-Sep-2016T DEF 55.000000
13 06-Sep-2016T DEF 58.333333
14 07-Sep-2016T DEF 105.000000
15 08-Sep-2016T DEF 104.333333
或:
In [31]: df.groupby('Client', as_index=False).rolling(3, min_periods=1, center=False).mean().reset_index(drop=True)
Out[31]:
Date Client Value
0 01-Sep-2016T ABC 160000.000000
1 02-Sep-2016T ABC 155000.000000
2 03-Sep-2016T ABC 166666.666667
3 04-Sep-2016T ABC 180000.000000
4 05-Sep-2016T ABC 176666.666667
5 06-Sep-2016T ABC 153333.333333
6 07-Sep-2016T ABC 148333.333333
7 08-Sep-2016T ABC 141333.333333
8 01-Sep-2016T DEF 200.000000
9 02-Sep-2016T DEF 150.000000
10 03-Sep-2016T DEF 150.000000
11 04-Sep-2016T DEF 86.666667
12 05-Sep-2016T DEF 55.000000
13 06-Sep-2016T DEF 58.333333
14 07-Sep-2016T DEF 105.000000
15 08-Sep-2016T DEF 104.333333
关于python - 使用 Pandas 计算 rolling.mean 时忽略给定列的前面的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39520283/
SQLite、Content provider 和 Shared Preference 之间的所有已知区别。 但我想知道什么时候需要根据情况使用 SQLite 或 Content Provider 或
警告:我正在使用一个我无法完全控制的后端,所以我正在努力解决 Backbone 中的一些注意事项,这些注意事项可能在其他地方更好地解决......不幸的是,我别无选择,只能在这里处理它们! 所以,我的
我一整天都在挣扎。我的预输入搜索表达式与远程 json 数据完美配合。但是当我尝试使用相同的 json 数据作为预取数据时,建议为空。点击第一个标志后,我收到预定义消息“无法找到任何内容...”,结果
我正在制作一个模拟 NHL 选秀彩票的程序,其中屏幕右侧应该有一个 JTextField,并且在左侧绘制弹跳的选秀球。我创建了一个名为 Ball 的类,它实现了 Runnable,并在我的主 Draf
这个问题已经有答案了: How can I calculate a time span in Java and format the output? (18 个回答) 已关闭 9 年前。 这是我的代码
我有一个 ASP.NET Web API 应用程序在我的本地 IIS 实例上运行。 Web 应用程序配置有 CORS。我调用的 Web API 方法类似于: [POST("/API/{foo}/{ba
我将用户输入的时间和日期作为: DatePicker dp = (DatePicker) findViewById(R.id.datePicker); TimePicker tp = (TimePic
放宽“邻居”的标准是否足够,或者是否有其他标准行动可以采取? 最佳答案 如果所有相邻解决方案都是 Tabu,则听起来您的 Tabu 列表的大小太长或您的释放策略太严格。一个好的 Tabu 列表长度是
我正在阅读来自 cppreference 的代码示例: #include #include #include #include template void print_queue(T& q)
我快疯了,我试图理解工具提示的行为,但没有成功。 1. 第一个问题是当我尝试通过插件(按钮 1)在点击事件中使用它时 -> 如果您转到 Fiddle,您会在“内容”内看到该函数' 每次点击都会调用该属
我在功能组件中有以下代码: const [ folder, setFolder ] = useState([]); const folderData = useContext(FolderContex
我在使用预签名网址和 AFNetworking 3.0 从 S3 获取图像时遇到问题。我可以使用 NSMutableURLRequest 和 NSURLSession 获取图像,但是当我使用 AFHT
我正在使用 Oracle ojdbc 12 和 Java 8 处理 Oracle UCP 管理器的问题。当 UCP 池启动失败时,我希望关闭它创建的连接。 当池初始化期间遇到 ORA-02391:超过
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve
引用这个plunker: https://plnkr.co/edit/GWsbdDWVvBYNMqyxzlLY?p=preview 我在 styles.css 文件和 src/app.ts 文件中指定
为什么我的条形这么细?我尝试将宽度设置为 1,它们变得非常厚。我不知道还能尝试什么。默认厚度为 0.8,这是应该的样子吗? import matplotlib.pyplot as plt import
当我编写时,查询按预期执行: SELECT id, day2.count - day1.count AS diff FROM day1 NATURAL JOIN day2; 但我真正想要的是右连接。当
我有以下时间数据: 0 08/01/16 13:07:46,335437 1 18/02/16 08:40:40,565575 2 14/01/16 22:2
一些背景知识 -我的 NodeJS 服务器在端口 3001 上运行,我的 React 应用程序在端口 3000 上运行。我在 React 应用程序 package.json 中设置了一个代理来代理对端
我面临着一个愚蠢的问题。我试图在我的 Angular 应用程序中延迟加载我的图像,我已经尝试过这个2: 但是他们都设置了 src attr 而不是 data-src,我在这里遗漏了什么吗?保留 d
我是一名优秀的程序员,十分优秀!