python - 如何使用 pandas 和 matplotlib 生成离散数据以传递到等高线图？-6ren

python - 如何使用 pandas 和 matplotlib 生成离散数据以传递到等高线图？

转载作者：太空宇宙更新时间：2023-11-03 20:25:23

25

4

我有两组连续数据，我想将它们传递到等高线图中。 x 轴是时间，y 轴是质量，z 轴是频率(如数据点出现的次数)。然而，大多数数据点并不相同，而是非常相似。因此，我怀疑对 x 轴和 y 轴进行离散化是最简单的。

这是我目前拥有的数据:

输入

import pandas as pd
df = pd.read_excel('data.xlsx')
df['Dates'].head(5)
df['Mass'].head(5)

输出

13   2003-05-09
14   2003-09-09
15   2010-01-18
16   2010-11-21
17   2012-06-29
Name: Date, dtype: datetime64[ns]

13    2500.0
14    3500.0
15    4000.0
16    4500.0
17    5000.0
Name: Mass, dtype: float64

我想转换数据，以便将一年内的数据点分组(例如:2003 年采集的所有数据点)，并将不同质量水平内的数据点分组(例如:3000-4000 之间的所有数据点)公斤)。接下来，代码将计算每个 block 内有多少个数据点，并将其作为 z 轴传递。

理想情况下，我还希望能够调整切片的级别。例如:每 100 公斤而不是 1000 公斤对点进行分组，或者传递不均匀分布的自定义级别列表。我该如何去做呢？

最佳答案

我认为您正在寻找的函数是 pd.cut

import pandas as pd
import numpy as np
import datetime

n = 10
scale = 1e3
Min = 0
Max = 1e4

np.random.seed(6)

Start = datetime.datetime(2000, 1, 1)
Dates = np.array([base + datetime.timedelta(days=i*180) for i in range(n)])
Mass = np.random.rand(n)*10000
df = pd.DataFrame(index = Dates, data = {'Mass':Mass})

print(df)

给你:

                   Mass
2000-01-01  8928.601514
2000-06-29  3319.798053
2000-12-26  8212.291231
2001-06-24   416.966257
2001-12-21  1076.566799
2002-06-19  5950.520642
2002-12-16  5298.173622
2003-06-14  4188.074286
2003-12-11  3354.078493
2004-06-08  6225.194322

如果您想按 1000 为单位对 Masses 进行分组，或者实现您自己的自定义 bin，您可以执行以下操作:

Bins,Labels=np.arange(Min,Max+.1,scale),(np.arange(Min,Max,scale))+(scale)/2
EqualBins = pd.cut(df['Mass'],bins=Bins,labels=Labels)
df.insert(1,'Equal Bins',EqualBins)

Bins,Labels=[0,1000,5000,10000],['Small','Medium','Big']
CustomBins = pd.cut(df['Mass'],bins=Bins,labels=Labels)
df.insert(2,'Custom Bins',CustomBins)

如果你只想显示年份、月份等，这很简单:

df['Year'] = df.index.year
df['Month'] = df.index.month

但如果您愿意，您也可以自定义日期范围:

Bins=[datetime.datetime(1999, 12, 31),datetime.datetime(2000, 9, 1),
      datetime.datetime(2002, 1, 1),datetime.datetime(2010, 9, 1)]


Labels = ['Early','Middle','Late']
CustomDateBins = pd.cut(df.index,bins=Bins,labels=Labels)
df.insert(3,'Custom Date Bins',CustomDateBins)

print(df)

这会产生你想要的东西:

                   Mass Equal Bins Custom Bins Custom Date Bins  Year  Month
2000-01-01  8928.601514     8500.0         Big            Early  2000      1
2000-06-29  3319.798053     3500.0      Medium            Early  2000      6
2000-12-26  8212.291231     8500.0         Big           Middle  2000     12
2001-06-24   416.966257      500.0       Small           Middle  2001      6
2001-12-21  1076.566799     1500.0      Medium           Middle  2001     12
2002-06-19  5950.520642     5500.0         Big             Late  2002      6
2002-12-16  5298.173622     5500.0         Big             Late  2002     12
2003-06-14  4188.074286     4500.0      Medium             Late  2003      6
2003-12-11  3354.078493     3500.0      Medium             Late  2003     12
2004-06-08  6225.194322     6500.0         Big             Late  2004      6

您可能也对 .groupby 函数感兴趣:

yeargroup = df.groupby(df.index.year).mean()
massgroup = df.groupby(df['Equal Bins']).count()
print(yeargroup)
print(massgroup)

             Mass    Year     Month
2000  6820.230266  2000.0  6.333333
2001   746.766528  2001.0  9.000000
2002  5624.347132  2002.0  9.000000
2003  3771.076389  2003.0  9.000000
2004  6225.194322  2004.0  6.000000
            Mass  Custom Bins  Custom Date Bins  Year  Month
Equal Bins                                                  
500.0          1            1                 1     1      1
1500.0         1            1                 1     1      1
2500.0         0            0                 0     0      0
3500.0         2            2                 2     2      2
4500.0         1            1                 1     1      1
5500.0         2            2                 2     2      2
6500.0         1            1                 1     1      1
7500.0         0            0                 0     0      0
8500.0         2            2                 2     2      2
9500.0         0            0                 0     0      0

关于python - 如何使用 pandas 和 matplotlib 生成离散数据以传递到等高线图？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57862177/

25

4

0

文章推荐： c# - 登录 Visual Studio 2010 后无法运行代码的原因是什么？

文章推荐： python - 将 pandas 系列从字符串转换为唯一的 int id

matplotlib - matplotlib 中对数极坐标图轴标签的定位
我无法在此图中定位轴标签。我喜欢放置顶部标签，使管道与网格对齐，并放置左右标签，以便它们不接触绘图。我试过了 ax.tick_params(axis='both', which='both'
matplotlib - matplotlib 中的条形图应该如何设置宽度？
我使用的是 python 2，下面的代码只是使用了一些示例数据，我的实际数据可能有不同的长度，并且可能不是很细。 import numpy as np import datetime i
matplotlib - Matplotlib 中的线段
给定坐标 [1,5,7,3,5,10,3,6,8]为 matplotlib.pyplot ，如何突出显示或着色线条的不同部分。例如，列表中的坐标 1-3 ( [1,5,7,3] ) 表示属性 a .我
matplotlib - Matplotlib 3D绘图中的较深背景
我正在matplotlib中绘制以下图像。我的问题是，图像看起来像这样，但是，我想使背景变暗，因为当我打印该图像时，灰度部分不会出现在打印物中。有人可以告诉我API进行此更改吗？我使用简单的API
matplotlib - matplotlib，逐步动画
这是关于matplotlib的一个非常基本的问题，但是我不知道该怎么做: 我想绘制多个图形，并使用绘制窗口中的箭头从一个移到另一个。目前，我只知道如何创建多个图并将其绘制在不同的窗口中，如下所示:
matplotlib - matplotlib 补丁绘图中的工件
在 matplotlib 中绘制小块对象时，由于显示分辨率而引入了伪影。使用抗锯齿并不能解决问题。这个问题有解决方案吗？ import matplotlib.pyplot as plt impo
matplotlib - matplotlib 中的未填充条形图
对于直方图，有一个简单的内置选项 histtype='step' .如何制作相同风格的条形图？最佳答案 [阅读评论后添加答案] 将可选关键字设置为 fill=False对于条形图: import m
matplotlib - matplotlib 子图中的图例位置
我正在尝试在 (6X3) 网格上创建子图。我对图例的位置有疑问。图例对所有子图都是通用的。 lgend 现在与 y 轴标签重叠我尝试删除 constrained_layout=True 选项。但这在
matplotlib - matplotlib 中的点和线工具提示？
我有一个带有一些线段( LineCollection )和一些点的图表。这些线和点有一些与它们相关的值，但没有绘制出来。我希望能够添加鼠标悬停工具提示或其他方法来轻松找到点和线的关联值。这对于点或线段
matplotlib - Matplotlib 图图例中的制表符对齐
我想创建一个带有对齐不同曲线文本的图例的图。这是一个最小的工作示例: import matplotlib.pyplot as plt import numpy as np x=np.linspace(
matplotlib - Matplotlib:图例中的水平线长
可以说我正在用matplotlib绘制一条线并添加一个图例。在图例中，其显示为------ Label。当绘制较小的图形尺寸以进行打印时，我发现该行的默认水平长度太长。是否存在将------ La
matplotlib - matplotlib 图形中的常见起源
我正在使用 matplotlib 构建一个 3D 散点图，但无法使生成的图形具有所有 3 个轴的共同原点。我怎样才能做到这一点？我的代码(到目前为止)，我还没有为轴规范实现任何定义，因为我对 Pyt
matplotlib - matplotlib 中是否存在用于在子图中定义子图网格的工具？
我有一个我想使用的绘图布局，其中 9 个不同的数据簇被布置在一个方形网格上。网格中的每个框都包含 3 个并排布置的箱线图。我最初的想法是这将适合 3x3 子图布局，每个单独的子图本身被划分为 3x1
matplotlib - Matplotlib，如何在数据坐标之外的图形外部编写注释？
我的图形从y=-1变为y=10 我想在任意位置写一小段文字，例如x=2000，y=5: ax.annotate('MgII', xy=(2000.0, 5.0), xycoords='data')
matplotlib - Matplotlib-在LateX表达式中使用变量
我想使用LateX格式来构建一个表达式，其中出现一些数字，但这些数字是用LateX表达式中的变量表示的。实际的目标是在axes.annotate()方法中使用它，但是为了讨论起见，这里是一个原理代码
matplotlib - Matplotlib 中的叠加轮廓图
我需要比较两组的二维分布。当我使用 matplotlib.pyplot.contourf并覆盖图，每个等高线图的背景颜色填充整个图空间。有没有办法让每个等高线图的最低等高线级别透明，以便更容易看到每
matplotlib - matplotlib —以交互方式选择点或位置？
在R中，有一个locator函数，类似于Matlab的ginput，您可以用鼠标单击图形并选择任何x，y坐标。此外，还有一个名为identify(x,y)的函数，如果您给它绘制了一组绘制的点x，y，然
matplotlib - matplotlib:生成矢量图
我想用matplotlib生成矢量图。我尽力了-但输出是光栅图像。这是我使用的： import matplotlib matplotlib.use('Agg') import matplotlib.p
matplotlib - matplotlib 中的小散点图标记始终为黑色
我正在尝试使用 matplotlib 制作具有非常小的灰点的散点图。由于点密度的原因，点需要很小。问题是 scatter() 函数的标记似乎既有线条又有填充。当标记很小时，只有线条可见，而看不到填充，
matplotlib - matplotlib 中的垂直线和水平线
我不太明白为什么我无法在指定的限制内创建水平和垂直线。我想用这个框绑定(bind)数据。然而，双方似乎并没有遵守我的指示。为什么是这样？ # CREATING A BOUNDING BOX # BOT

首页

博学

6Ren·AI

商城

python - 如何使用 pandas 和 matplotlib 生成离散数据以传递到等高线图？