gpt4 book ai didi

python - Pyplot 堆积直方图 - 列中出现的次数

转载 作者:太空宇宙 更新时间:2023-11-03 14:23:16 25 4
gpt4 key购买 nike

我正在尝试以直方图的形式呈现从防火墙日志收集的数据表,以便文件中的每个日期都有一个条形,以及堆积在条形图中的某一列中出现的次数。

我在这里研究了几个例子,但它们似乎都是基于这样一个事实:我知道特定列中有哪些值 - 而我在这里试图实现的是呈现直方图的方法,而无需了解所有可能的领域。

在示例中,我使用协议(protocol)作为列:

#!/usr/bin/python

import pandas as pd
import numpy as np
import glob
import matplotlib.pyplot as plt

csvs = glob.glob("*log-export.csv")
dfs = [pd.read_csv(csv, sep="\xff", engine="python") for csv in csvs]

df_merged = pd.concat(dfs).fillna("")

data = df_merged[['date', 'proto']]
np_data = np.array(data)

plt.hist(np_data, stacked=True)
plt.show()

但这显示了下图:

histogram

我想完成这样的事情:

stacked

有什么建议可以实现这一目标吗?

最佳答案

设置
我不得不弥补数据,因为你没有提供任何数据。

df = pd.DataFrame(dict(
Date=pd.date_range(end=pd.to_datetime('now'), periods=100, freq='H'),
Proto=np.random.choice('UDP TCP ICMP'.split(), 100, p=(.3, .5, .2))
))
<小时/>

解决方案
使用 pd.crosstab 然后绘图

pd.crosstab(df.Date.dt.date, df.Proto).plot.bar(stacked=True)

enter image description here

关于python - Pyplot 堆积直方图 - 列中出现的次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47807693/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com