gpt4 book ai didi

python - 在Python中,绘制具有相同x轴和y轴的不同类别数据的方法是什么?

转载 作者:行者123 更新时间:2023-12-01 00:19:55 26 4
gpt4 key购买 nike

背景信息:我正在使用消费者金融保护局的消费者投诉数据集。我想通过绘制 y 上的投诉计数和 x 上的时间来绘制投诉时间序列图,为每种类型的投诉绘制一条线。我想看看这些值(value)观如何随着时间的推移而变化。到目前为止,我已经尝试过 Seaborn 和 Plotly。以下是 Plotly 中的内容。

trace1 = go.Scatter(x=df.DateReceived,
y=df.Sum,
name = "Time Series of Types of Complaints",
line = dict(color = 'blue'),
opacity = 0.4)

layout = dict(title='Time Series of Types of Complaints',)

fig = dict(data=[trace1], layout=layout)
iplot(fig)

Attempted Plot

数据框如下所示:

data = {'Date': ['2011-12-01', '2011-12-06', '2011-12-06', '2011-12-07', '2011-12-07'], 'Issue':  ['Loan Modification', 'Loan Servicing', 'Loan Servicing', 'Loan Modification', 'Loan Servicing'], 'Sum': [1, 1, 2, 2, 3]}

df = pd.DataFrame(data)

我知道我的 plotly 中的问题在于它将所有不同的总和连接在一起而不是分开它们。

我知道我可以针对每种不同类型的投诉将每个总和分成不同的列。然后手动添加每个跟踪,执行如下操作(取自 Plotly 网站):

fig.add_trace(go.Scatter(
x=df.Date,
y=df['AAPL.Low'],
name="AAPL Low",
line_color='dimgray',
opacity=0.8))

但是必须有一种更简单/更少暴力的方法,我可以将所有总和保留在一列中,并按问题类型进行描述。

最佳答案

为了说明像您这样的数据集随着时间的推移的发展,实际上没有必要引入一个类别作为颜色变化,如 sns.lmplot(data=movies, x='CriticRating',y ='AudienceRating', fit_reg=False, Hue='Genre') 就可以了。由于这不是真正的问题,只是在评论中简要提到,所以我会坚持使用分组(或堆叠)条形图或折线图。以下是如何使用plotly 来完成此操作。

堆积柱形图:

分组柱形图的绘图:

enter image description here

分组柱形图代码:

# imports
import plotly.graph_objs as go
import pandas as pd
import numpy as np

# data
data = {'Date': ['2011-12-01', '2011-12-06', '2011-12-06', '2011-12-07', '2011-12-07'], 'Issue': ['Loan Modification', 'Loan Servicing', 'Loan Servicing', 'Loan Modification', 'Loan Servicing'], 'Sum': [1, 1, 2, 2, 3]}
df = pd.DataFrame(data)

# build figure
fig=go.Figure(data=[go.Bar(name='Modification',
x=df[df['Issue']=='Loan Modification']['Date'],
y=df[df['Issue']=='Loan Modification']['Sum']),

go.Bar(name='Servicing',
x=df[df['Issue']=='Loan Servicing']['Date'],
y=df[df['Issue']=='Loan Servicing']['Sum'])])


# Change the bar mode
fig.update_layout(barmode='group')
#fig.update_layout(barmode='stack')

# show figure
fig.show()

堆积柱形图的绘图:

enter image description here

堆积柱形图代码:

只需使用与上面相同的代码片段,但包含该行

fig.update_layout(barmode='stack') 就在 fig.show()

之前

折线图:

只需将 go.Bar() 替换为 go.Scatter() 即可得到:

折线图绘制:

enter image description here

折线图代码:

# imports
import plotly.graph_objs as go
import pandas as pd
import numpy as np

# data
data = {'Date': ['2011-12-01', '2011-12-06', '2011-12-06', '2011-12-07', '2011-12-07'], 'Issue': ['Loan Modification', 'Loan Servicing', 'Loan Servicing', 'Loan Modification', 'Loan Servicing'], 'Sum': [1, 1, 2, 2, 3]}
df = pd.DataFrame(data)

# build figure
fig=go.Figure(data=[go.Scatter(name='Modification',
x=df[df['Issue']=='Loan Modification']['Date'],
y=df[df['Issue']=='Loan Modification']['Sum']),

go.Scatter(name='Servicing',
x=df[df['Issue']=='Loan Servicing']['Date'],
y=df[df['Issue']=='Loan Servicing']['Sum'])])

# show figure
fig.show()

如果你觉得这个 plotly 有点奇怪,我完全同意。但这是因为您在数据样本中的 2012-12-16 上获得了两个关于 Loan Servicing 的观察结果。您可以通过在绘图之前正确分组数据框来解决这个问题。

希望这有帮助!如果这不适合您,请随时告诉我!

关于python - 在Python中,绘制具有相同x轴和y轴的不同类别数据的方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59021609/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com