- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是我第一次使用 pandas 和 iPython 笔记本,无法找出解决我的问题的正确搜索词。
我有一个 .xls
文件,用于存放位于 3 个站点 A
、B
和 的 3 个构建服务器的编译时间数据C
。这些构建服务器编译多个项目,因此我将选择任何特定项目。因此,我需要绘制这样的数据(对于特定项目 - 不是全部在一张图中,以保持简单):
X-axis = date
Y-axis = average build time on that date
3 lines for sites A, B and C
到目前为止我所做的:
import pandas as pd
import numpy as np
import matplotlib as plt
file= r'/home/abc/Downloads/request.xls'
df = pd.read_excel(file,parse_dates=['Date'])
build_times = df[['Date','site','project','Duration']]
build_group = build_times.groupby(['Date','site','project']).mean()
我需要以下方面的帮助:
我如何仅选择成功的构建如果有一个 status
列包含 0 和 1。
如何使用上述 X 和 Y 绘制站点 A
、B
和 C
(针对特定项目)的线条轴。
编辑
经过@jezrael的回答,我能够得到以下数据
2017-03-27 A project1 963.200000
B project2 4587.176471
C project2 1449.375000
C project1 1449.375000
.......
2017-03-28 A project1 93.200000
B project1 4787.176471
C project2 1339.375000
C project1 1749.375000
最佳答案
我认为您需要首先按 boolean indexing
进行过滤或query
:
build_group = build_times[build_times['status'] == 1]
.groupby(['Date','site','project'])['Duration'].mean()
或者:
build_group = build_times.query('status == 1')
.groupby(['Date','site','project'])['Duration'].mean()
输出与:
d={'Duration': [963.2, 4587.176471, 1449.375, 1449.375, 93.2, 4787.176471, 1339.375, 1749.375],
'project': ['project1', 'project2', 'project2', 'project1', 'project1', 'project1', 'project2', 'project1'],
'Date': [pd.Timestamp('2017-03-27 00:00:00'), pd.Timestamp('2017-03-27 00:00:00'), pd.Timestamp('2017-03-27 00:00:00'), pd.Timestamp('2017-03-27 00:00:00'), pd.Timestamp('2017-03-28 00:00:00'), pd.Timestamp('2017-03-28 00:00:00'), pd.Timestamp('2017-03-28 00:00:00'), pd.Timestamp('2017-03-28 00:00:00')],
'site': ['A', 'B', 'C', 'C', 'A', 'B', 'C', 'C']}
build_group = pd.DataFrame(d).set_index(['Date','site','project'])['Duration']
print (build_group)
Date site project
2017-03-27 A project1 963.200000
B project2 4587.176471
C project2 1449.375000
project1 1449.375000
2017-03-28 A project1 93.200000
B project1 4787.176471
C project2 1339.375000
project1 1749.375000
Name: Duration, dtype: float64
然后通过 unstack
reshape 形状与 level=1
(因为 level==1
是 sites
)并按 xs
选择。最后plot
:
#for check column names for typos
print (build_group.index.get_level_values(2).unique().tolist())
['project1', 'project2']
p = 'project1'
build_group = build_group.unstack(level=1).xs(p, level=1, axis=0)
print (build_group)
site A B C
Date
2017-03-27 963.2 NaN 1449.375
2017-03-28 93.2 4787.176471 1749.375
build_group.plot()
关于python - 如何对数据进行分组并绘制折线图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44774151/
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
折线图是一种用于可视化数据变化趋势的图表,它可以用于表示任何数值随着时间或类别的变化。 折线图由折线段和折线交点组成,折线段表示数值随时间或类别的变化趋势,折线交点表示数据的转折点。 折
我是 d3 和 typescript 的新手。 我正在尝试使用 d3 v4 和 typescript 创建一个简单的折线图。 但是,我收到了一个 typescript 错误,如下图所示: 问题是什么?
我是 Qlikview 的新手,经过几次失败的尝试后,我不得不请求一些有关 Qlikview 中图表的指导。我想创建折线图,其中包含: 一维 - 一个月的时间段按天数分割 一个表达式 - 每天创建的任
我正在尝试使用 Firebase 实时数据库中的数据在 Android 中制作折线图。 这是数据库的结构: enter image description here 这是代码: public clas
我有一个 TSQL 查询,它提供了一些性能基线的一个月数据。我用折线图显示数据。现在我想在报告中添加更多参数,以提供从两个不同月份选择数据的选项,并将其显示在同一个折线图中以进行比较。我不知道如何开始
我有一个简单(但非常大)的数据集,其中包含从 4 月到 8 月在不同站点进行的计数。 在 4 月中旬和 7 月之间,没有零计数 - 但零线从最早到最晚的日期延伸。 以下是用于制作上述图表的部分数据(列
我正在创建一个折线图,我想在不改变线条长度的情况下增加线条的高度或厚度。 在增加宽度属性之前,它看起来像这样: 增加宽度属性后,它看起来像这样: 我只想增加 height,但是没有这样的属性,所以我尝
我想在折线图的顶部显示值。我看过this answer这很有帮助,但它改变了折线图节点。我想要的是相同的想法,但不在节点上显示值,而是在它们附近(可能在它们的右侧和上方)显示值,例如:
我正在尝试使用谷歌图表以折线图的形式显示mysql数据。我认为问题出在我尝试格式化谷歌图表数据的部分。我的代码有什么问题吗? $sth = mysql_query("SELECT * FROM rea
我有 JavaFX LineChart 和一些带有 XYChart.Series 对象的数据 XYChart.Series series = new XYChart.Series(); series.
给定: 理想图 - 描绘了我的机器应该具有的预期读数。实际图表 - 描述我的机器在该实例中的实际读数。 X轴:来自机器的力(N) Y 轴:时间 这两个图都是使用 python 中的 pyplot 库创
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 6 年前。
<% function table2(total,table_x,table_y,all_width,all_height,line_n
我想根据数据中的一列离散值过滤使用 plotly 创建的图表。最终目标是能够使用按钮来更新过滤值,所以我不想事先过滤数据。 library(plotly) df % filter(group1=
我正在尝试在 JavaFX 中创建折线图。此折线图应该有一个轴 (y) 与数字和另一个轴 (x) 与日期。日期范围应该由用户使用两个日期选择器来选择。现在这是我的问题:折线图只有类别和数字轴。有什么方
我正在使用 nivo 折线图,并希望将 x 轴用作时间线,最多一分钟。 不幸的是,我无法呈现该图表,因为它无法正确读取日期。例如,这是我的数据的一部分: { x: "2020-04-24T13:07:
我有一个用 gRaphael 创建的折线图。它有轴和刻度线,但我想要网格线。是否有内置的方法来实现这一点或可以帮助我的附加库? 最佳答案 gRaphael 没有添加网格线的内置方法,但绘制它们非常容易
我正在生成一份报告,该报告是根据查询字符串在网页的页面加载时生成的。我在电子表格中生成的单元格数据完全符合我的要求。现在我需要添加一个折线图。数据是动态的,行数会有所不同。 搜索后没有信息,这与在 .
我正在尝试使用 highcharts 中每 x 秒更新一次的折线图。理想情况下,我希望它使用一些特定数据进行初始化,并每 x 秒轮询一次 Web 服务,并进行相应更新。 目前,我只是尝试使用网络服务中
我是一名优秀的程序员,十分优秀!