- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一组 1000 个(2D)pd.Dataframe
(比如,index:time, columns: run_id),每个都有 3 个属性(比如温度、压力、位置) )。理想情况下,我希望将所有内容都放在 5 维的 xr.DataArray
中(或 4 维的 xr.Dataset
并将最后一个维度作为唯一数据变量)。
我创建了一个具有两个暗淡和 2+3 坐标的 DataArray,但 xr.concat 似乎不适用于多个维度。 (我遵循了这里提到的方法Add 'constant' dimension to xarray Dataset。)
示例:我从各个数据帧和属性列表构建 DataArray。
# Mock data:
data = {}
for i in np.arange(500):
data[i] = pd.DataFrame(np.random.randn(1000, 8), index=pd.DatetimeIndex(start='01.01.2013',periods=1000,freq='h'),
columns=list('ABCDEFGH'))
df_catalogue = pd.DataFrame(np.random.choice(10,(500, 3)), columns=['temp','pre','zon'])
#Build DataArrays adding scalar coords
res_da = []
for i,v in df_catalogue.iterrows():
i_df = data[i] # data is a dictionary of properly indexed dataframes
da = xr.DataArray(i_df.values,
coords={'time':i_df.index.values,'runs':i_df.columns.values,
'temp':v['temp'], 'pre':v['pre'],'zon':v['zon']},
dims=['time','runs'])
res_da.append(da)
但是当我尝试 all_da = xr.concat(res_da, dim=['temp','pre','zon'])
时,我得到了奇怪的结果。实现这样的目标的最佳方法是什么:
<xarray.DataArray (time: 8000, runs: 50, temp:8, pre:10, zon: 5)>
array([[[ 4545.453613, 4545.453613, ..., 4545.453613, 4545.453613],
[ 4545.453613, 4545.453613, ..., 4545.453613, 4545.453613],
...,
[ 4177.425781, 4177.425781, ..., 4177.425781, 4177.425781]]], dtype=float32)
Coordinates:
* runs (runs) object 'A' 'B' ...
* time (time) datetime64[ns] 2013-12-31T23:00:00 2014-01-01 ...
* zon (zon) 'zon1', 'zon2', 'zon3', ......
* temp (temp) 'XX' 'YY', 'ZZ' .....
* pre (pre) 'AAA', 'BBB', 'CCC' ....
最佳答案
xarray.concat
仅支持沿单个维度串联。但我们可以通过连接、设置 MultiIndex 然后取消堆叠来解决这个问题。
我正在更改您的设置代码,因为这仅在您正在构建的新坐标的每个组合 (['temp','pre','zon']
) 都是唯一的情况下才有效:
import numpy as np
import pandas as pd
import xarray as xr
import itertools
data = {}
for i in np.arange(500):
data[i] = pd.DataFrame(np.random.randn(1000, 8),
index=pd.DatetimeIndex(start='01.01.2013',periods=1000,freq='h'),
columns=list('ABCDEFGH'))
cat_data = [(x, y, z)
for x in range(20)
for y in ['a', 'b', 'c', 'd', 'e']
for z in ['A', 'B', 'C', 'D', 'E']]
df_catalogue = pd.DataFrame(cat_data, columns=['temp','pre','zon'])
#Build DataArrays adding scalar coords
res_da = []
for i,v in df_catalogue.iterrows():
i_df = data[i] # data is a dictionary of properly indexed dataframes
da = xr.DataArray(i_df.values,
coords={'time':i_df.index.values,'runs':i_df.columns.values,
'temp':v['temp'], 'pre':v['pre'],'zon':v['zon']},
dims=['time','runs'])
res_da.append(da)
然后,我们可以简单地写:
xr.concat(res_da, dim='prop').set_index(prop=['temp', 'pre', 'zon']).unstack('prop')
这会产生您想要的 5D 数组:
<xarray.DataArray (time: 1000, runs: 8, temp: 20, pre: 5, zon: 5)>
array([[[[[-0.690557, ..., -1.526415],
...,
[ 0.737887, ..., 1.585335]],
...,
[[ 0.99557 , ..., 0.256517],
...,
[ 0.179632, ..., -1.236502]]],
...,
[[[ 0.234426, ..., -0.149901],
...,
[ 1.492255, ..., -0.380909]],
...,
[[-0.36111 , ..., -0.451571],
...,
[ 0.10457 , ..., 0.722738]]]]])
Coordinates:
* time (time) datetime64[ns] 2013-01-01 2013-01-01T01:00:00 ...
* runs (runs) object 'A' 'B' 'C' 'D' 'E' 'F' 'G' 'H'
* temp (temp) int64 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
* pre (pre) object 'a' 'b' 'c' 'd' 'e'
* zon (zon) object 'A' 'B' 'C' 'D' 'E'
关于python - xarray 多索引连接的最佳实践,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48749015/
本文分享自华为云社区《大模型LLM之分布式训练》,作者: 码上开花_Lancer。 随着语言模型参数量和所需训练数据量的急速增长,单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训
本文分享自华为云社区《五大基础算法--动态规划法》,作者: 大金(内蒙的)。 一、基本概念 动态规划法,和分治法极其相似。区别就是,在求解子问题时,会保存该子问题的解,后面的子问题求解时,可以直接拿来
pip install scp pip install pexpect 测试代码: import os import stat import paramiko # 用于调用scp命令 def s
我目前正在实现“ token ”REST 服务。 token 只是一个字符串,由一些参数构建而成,然后经过哈希处理并在一定时间后过期。 我想在我的 REST 服务中有一个可以验证 token 的端点,
打开软删除后,我在客户端上添加一条记录,推送,删除添加的记录推送,然后尝试使用与初始记录相同的主键添加新记录(然后推送),我得到一个异常(exception)。 EntityDomainManager
打开软删除后,我在客户端上添加一条记录,推送,删除添加的记录推送,然后尝试使用与初始记录相同的主键添加新记录(然后推送),我得到一个异常(exception)。 EntityDomainManager
我有一个应用程序,每 x 秒接收一次天气信息。我想将此数据保存到 XML 文件中。 我应该为每个天气通知创建一个新的 XML 文件,还是将每个通知附加到同一个 XML 文件中?我不确定 XML 标准的
我猜我们大多数人都必须在某个时候处理这个问题,所以我想我会问这个问题。 当您的 BLL 中有很多集合并且您发现自己一遍又一遍地编写相同的旧内联(匿名)谓词时,显然有必要进行封装,但实现封装的最佳方
我有一些 c# 代码已经运行了一段时间了..我不得不说,虽然我了解 OO 原则的基础知识,但显然有不止一种方法可以给猫剥皮(尽管我讨厌那个短语!)。 因此,我有一个基本抽象类作为基本数据服务类,如下所
我设计了一个 SQL 数据库系统(使用 Postgre),我有一个问题,即创建一个关系/引用的常见做法是什么,这种关系/引用即使在引用的对象被删除时也能持续存在。 比如有一个UserORM,还有Act
我们的目标是搜索用户输入的字符串并计算在其中找到多少元音。不幸的是我被困在这里,有什么帮助吗? def numVowels(s): vowels= "AEIOUaeiou" if s
我有一个适用于我的“items”int 数组的旋转函数。下面的代码完成了它,除了我不必要地传输值。我正在努力实现“就地”轮换。我的意思是 ptrs 会递增或递减,而不是从数组中获取值。我需要通过这种方
我有一个 json 存储在我的应用程序文档文件夹中,我需要在我的所有 View 中使用它。我正在加载 json 并将其添加到每个 View 中的 NSMutableArray。但现在我了解到,我可以将
我用 C++ 开始了一个项目。这种语言的内存管理对我来说是新的。 我过去常常使用 new () 创建对象,然后传递指针,虽然它可以工作,但调试起来很痛苦,人们看到代码时会用有趣的眼神看着我。我为它没有
已结束。 这个问题是 off-topic .它目前不接受答案。 想要改进这个问题? Update the question所以它是on-topic堆栈溢出。 关闭 10 年前。 Improve thi
保持类松散耦合是编写易于理解、修改和调试的代码的一个重要方面——我明白这一点。然而,作为一个新手,几乎任何时候我都会超越我所苦苦挣扎的最简单的例子。 我或多或少地了解如何将字符串、整数和简单数据类型封
我发现我需要编写大量重复代码,因为我无法从其他 Controller 调用函数。例如,这里新闻提要内容在我的代码中重复,我对一个 Controller 做一些特定的事情,然后需要像这样加载我的新闻提要
假设需要一种数字数据类型,其允许值在指定范围内。更具体地说,假设要定义一个整数类型,其最小值为0,最大值为5000。这种情况在很多情况下都会出现,例如在对数据库数据类型,XSD数据类型进行建模时。 在
假设我想循环整个数组来访问每个元素。使用 for 循环、for...in 循环或 for...of 循环是 JavaScript 开发人员的标准做法吗? 例如: var myArray = ["app
我有一个旧的 SL4/ria 应用程序,我希望用 Breeze 取代它。我有一个关于内存使用和缓存的问题。我的应用程序加载工作列表(一个典型的用户可以访问大约 1,000 个这些工作)。此外,还有很多
我是一名优秀的程序员,十分优秀!