gpt4 book ai didi

python - 使用 Pandas 进行多次时变试验

转载 作者:太空宇宙 更新时间:2023-11-04 04:47:29 25 4
gpt4 key购买 nike

我刚刚接触 Pandas,想找出一种保存与多次试验相对应的时变数据的好方法。

一个具体的例子可能是:

Trial 1: Salinity = 0.1 (unchanging), pH (at time 1, 2, ...)
Trial 2: Salinity = 0.1 (unchanging), pH (at time 1, 2, ...)
Trial 3: Salinity = 0.2 (unchanging), pH (at time 1, 2, ...)
Trial 4: Salinity = 0.2 (unchanging), pH (at time 1, 2, ...)

您会注意到,可以使用相同的初始参数(盐度)但使用不同的时变变量 (pH) 重复多次实验。

DataFrame 是二维的,因此我必须为每个试验创建一个 DataFrame。这是解决问题的最佳方法吗?我如何才能将它们结合起来(例如:随着时间的推移获得平均 pH 值,以便使用相同的初始设置进行试验)?

最佳答案

您可以在单个 pd.DataFrame 中聚合跨试验的数据.下面是一个例子。

df = pd.DataFrame({'Trial': [1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4],
'Date': [1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4],
'Salinity': [0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1,
0.2, 0.2, 0.2, 0.2, 0.2, 0.2, 0.2, 0.2],
'pH': [2, 4, 1, 4, 6, 8, 3, 2, 9, 3, 1, 4, 6, 11, 4, 6]})

df = df.set_index(['Trial', 'Date', 'Salinity'])

# pH
# Trial Date Salinity
# 1 1 0.1 2
# 2 0.1 4
# 3 0.1 1
# 4 0.1 4
# 2 1 0.1 6
# 2 0.1 8
# 3 0.1 3
# 4 0.1 2
# 3 1 0.2 9
# 2 0.2 3
# 3 0.2 1
# 4 0.2 4
# 4 1 0.2 6
# 2 0.2 11
# 3 0.2 4
# 4 0.2 6

解释

  • 在您的数据框构造中,分配一个标识符列,在本例中为 Trial带有一个整数标识符。
  • 通过 ['Trial', 'Date', 'Salinity'] 设置索引为 pandas 提供自然索引用于分组、索引和切片。
  • 例如,df.loc[(1, 2, 0.1)]将返回 pd.Series源自指示 pH = 4 的数据框。

关于python - 使用 Pandas 进行多次时变试验,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49183985/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com