python - 将 2D Panda 的 DataFrame 列表转换为 3D DataFrame-6ren

python - 将 2D Panda 的 DataFrame 列表转换为 3D DataFrame

转载作者：行者123 更新时间：2023-11-28 17:17:40

我正在尝试创建一个将标签值保存到 2D DataFrame 的 Pandas DataFrame。这是我到目前为止所做的:

我正在使用 pd.read_csv 读取 csv 文件并将它们附加到列表中，为了这个问题的目的让我们考虑以下代码:

import numpy as np
import pandas as pd

raw_sample = []
labels = [1,1,1,2,2,2]
samples = np.random.randn(6, 5, 4)
for contents in range(samples.shape[0]):
    raw_sample.append(pd.DataFrame(samples[contents]))

然后，我将 raw_sample 添加到 df=d.DataFrame(raw_sample)。然后我通过执行以下操作将标签添加到 df:

df = df.set_index([df.index, labels])
df.index = df.index.set_names('index', level=0)
df.index = df.index.set_names('labels', level=1)

我试过打印这个，我得到了

                                                              0
index labels                                                   
0     1                 0         1         2         3
0  0...
1     1                 0         1         2         3
0  0...
2     1                 0         1         2         3
0  1...
3     2                 0         1         2         3
0 -0...
4     2                 0         1         2         3
0  0...
5     2                 0         1         2         3
0 -0...

我也试过打印df[0]，还是一样。

我想知道是不是这样的

index  labels         0
  0      1      1 2 3 4 5 6 7
                3 5 6 7 9 5 4
                3 4 5 6 7 8 9
  1      1      4 3 2 4 5 6 7
                3 5 6 7 4 5 6 
                2 3 4 3 4 5 3
...

我知道 DataFrame 不能采用二维数组，另一件事是使用 pd.Panel，为此我将 raw_sample 的所有内容转换为 numpy 数组并然后将 raw_sample 本身转换为 numpy 数组并执行以下操作:

p1 = pd.Panel(samples, items=map(str, labels))

但是当我打印这个的时候，我得到了

<class 'pandas.core.panel.Panel'>
Dimensions: 6 (items) x 5 (major_axis) x 4 (minor_axis)
Items axis: 1 to 2
Major_axis axis: 0 to 4
Minor_axis axis: 0 to 3

查看 Items，所有常用值似乎都组合在一起。

我现在不知道该怎么办。帮忙!!

更新

输入:

labels = [1,1,1,2,2,2]
samples = [5x4 pd.DataFrame, 5x4 pd.DataFrame, 5x4 pd.DataFrame, 5x4 pd.DataFrame, 5x4 pd.DataFrame, 5x4 pd.DataFrame]

期望的输出:

index  labels      samples
  0      1      1 2 3 4 5 6 7
                3 5 6 7 9 5 4
                3 4 5 6 7 8 9
  1      1      4 3 2 4 5 6 7
                3 5 6 7 4 5 6 
                2 3 4 3 4 5 3
...

最佳答案

如果选择的项目不唯一，则获取另一个 Panel:

np.random.seed(10)
labels = [1,1,1,2,2,2]
samples = np.random.randn(6, 5, 4)
p1 = pd.Panel(samples, items=map(str, labels))
print (p1)
<class 'pandas.core.panel.Panel'>
Dimensions: 6 (items) x 5 (major_axis) x 4 (minor_axis)
Items axis: 1 to 2
Major_axis axis: 0 to 4
Minor_axis axis: 0 to 3

print (p1['1'])
<class 'pandas.core.panel.Panel'>
Dimensions: 3 (items) x 5 (major_axis) x 4 (minor_axis)
Items axis: 1 to 1
Major_axis axis: 0 to 4
Minor_axis axis: 0 to 3

print (p1.to_frame())
                    1         1         1         2         2         2
major minor                                                            
0     0      1.331587  1.331587  1.331587 -0.232182 -0.232182 -0.232182
      1      0.715279  0.715279  0.715279 -0.501729 -0.501729 -0.501729
      2     -1.545400 -1.545400 -1.545400  1.128785  1.128785  1.128785
      3     -0.008384 -0.008384 -0.008384 -0.697810 -0.697810 -0.697810
1     0      0.621336  0.621336  0.621336 -0.081122 -0.081122 -0.081122
      1     -0.720086 -0.720086 -0.720086 -0.529296 -0.529296 -0.529296
      2      0.265512  0.265512  0.265512  1.046183  1.046183  1.046183
      3      0.108549  0.108549  0.108549 -1.418556 -1.418556 -1.418556
2     0      0.004291  0.004291  0.004291 -0.362499 -0.362499 -0.362499
      1     -0.174600 -0.174600 -0.174600 -0.121906 -0.121906 -0.121906
      2      0.433026  0.433026  0.433026  0.319356  0.319356  0.319356
      3      1.203037  1.203037  1.203037  0.460903  0.460903  0.460903
3     0     -0.965066 -0.965066 -0.965066 -0.215790 -0.215790 -0.215790
      1      1.028274  1.028274  1.028274  0.989072  0.989072  0.989072
      2      0.228630  0.228630  0.228630  0.314754  0.314754  0.314754
      3      0.445138  0.445138  0.445138  2.467651  2.467651  2.467651
4     0     -1.136602 -1.136602 -1.136602 -1.508321 -1.508321 -1.508321
      1      0.135137  0.135137  0.135137  0.620601  0.620601  0.620601
      2      1.484537  1.484537  1.484537 -1.045133 -1.045133 -1.045133
      3     -1.079805 -1.079805 -1.079805 -0.798009 -0.798009 -0.798009

但是如果有唯一的，获取DataFrame:

np.random.seed(10)
labels = list('abcdef')
samples = np.random.randn(6, 5, 4)
p1 = pd.Panel(samples, items=labels)
print (p1)
<class 'pandas.core.panel.Panel'>
Dimensions: 6 (items) x 5 (major_axis) x 4 (minor_axis)
Items axis: a to f
Major_axis axis: 0 to 4
Minor_axis axis: 0 to 3

print (p1['a'])
          0         1         2         3
0  1.331587  0.715279 -1.545400 -0.008384
1  0.621336 -0.720086  0.265512  0.108549
2  0.004291 -0.174600  0.433026  1.203037
3 -0.965066  1.028274  0.228630  0.445138
4 -1.136602  0.135137  1.484537 -1.079805

print (p1.to_frame())
                    a         b         c         d         e         f
major minor                                                            
0     0      1.331587 -1.977728  0.660232 -0.232182  1.985085  0.117476
      1      0.715279 -1.743372 -0.350872 -0.501729  1.744814 -1.907457
      2     -1.545400  0.266070 -0.939433  1.128785 -1.856185 -0.922909
      3     -0.008384  2.384967 -0.489337 -0.697810 -0.222774  0.469751
1     0      0.621336  1.123691 -0.804591 -0.081122 -0.065848 -0.144367
      1     -0.720086  1.672622 -0.212698 -0.529296 -2.131712 -0.400138
      2      0.265512  0.099149 -0.339140  1.046183 -0.048831 -0.295984
      3      0.108549  1.397996  0.312170 -1.418556  0.393341  0.848209
2     0      0.004291 -0.271248  0.565153 -0.362499  0.217265  0.706830
      1     -0.174600  0.613204 -0.147420 -0.121906 -1.994394 -0.787269
      2      0.433026 -0.267317 -0.025905  0.319356  1.107708  0.292941
      3      1.203037 -0.549309  0.289094  0.460903  0.244544 -0.470807
3     0     -0.965066  0.132708 -0.539879 -0.215790 -0.061912  2.404326
      1      1.028274 -0.476142  0.708160  0.989072 -0.753893 -0.739357
      2      0.228630  1.308473  0.842225  0.314754  0.711959 -0.312829
      3      0.445138  0.195013  0.203581  2.467651  0.918269 -0.348882
4     0     -1.136602  0.400210  2.394704 -1.508321 -0.482093 -0.439026
      1      0.135137 -0.337632  0.917459  0.620601  0.089588  0.141104
      2      1.484537  1.256472 -0.112272 -1.045133  0.826999  0.273049
      3     -1.079805 -0.731970 -0.362180 -0.798009 -1.954512 -1.618571

它与具有非唯一列的 DataFrame 相同:

samples = np.random.randn(6, 5)
df = pd.DataFrame(samples, columns=list('11122'))
print (df)
          1         1         1         2         2
0  0.346338 -0.855797 -0.932463 -2.289259  0.634696
1  0.272794 -0.924357 -1.898270 -0.743083 -1.587480
2 -0.519975 -0.136836  0.530178 -0.730629  2.520821
3  0.137530 -1.232763  0.508548 -0.480384 -1.213064
4 -0.157787 -1.600004 -1.287620  0.384642 -0.568072
5 -0.649427 -0.659585 -0.813359 -1.487412 -0.044206

print (df['1'])
          1         1         1
0  0.346338 -0.855797 -0.932463
1  0.272794 -0.924357 -1.898270
2 -0.519975 -0.136836  0.530178
3  0.137530 -1.232763  0.508548
4 -0.157787 -1.600004 -1.287620
5 -0.649427 -0.659585 -0.813359

编辑:

同样为了从列表中创建df需要唯一的标签(没有唯一的引发错误)和函数concat带有参数 keys，用于 Panel 调用 to_panel :

np.random.seed(100)
raw_sample = []
labels = list('abcdef')
samples = np.random.randn(6, 5, 4)
for contents in range(samples.shape[0]):
    raw_sample.append(pd.DataFrame(samples[contents]))

df = pd.concat(raw_sample, keys=labels)
print (df)
            0         1         2         3
a 0 -1.749765  0.342680  1.153036 -0.252436
  1  0.981321  0.514219  0.221180 -1.070043
  2 -0.189496  0.255001 -0.458027  0.435163
  3 -0.583595  0.816847  0.672721 -0.104411
  4 -0.531280  1.029733 -0.438136 -1.118318
b 0  1.618982  1.541605 -0.251879 -0.842436
  1  0.184519  0.937082  0.731000  1.361556
  2 -0.326238  0.055676  0.222400 -1.443217
  3 -0.756352  0.816454  0.750445 -0.455947
  4  1.189622 -1.690617 -1.356399 -1.232435
c 0 -0.544439 -0.668172  0.007315 -0.612939
  1  1.299748 -1.733096 -0.983310  0.357508
  2 -1.613579  1.470714 -1.188018 -0.549746
  3 -0.940046 -0.827932  0.108863  0.507810
  4 -0.862227  1.249470 -0.079611 -0.889731
d 0 -0.881798  0.018639  0.237845  0.013549
  1 -1.635529 -1.044210  0.613039  0.736205
  2  1.026921 -1.432191 -1.841188  0.366093
  3 -0.331777 -0.689218  2.034608 -0.550714
  4  0.750453 -1.306992  0.580573 -1.104523
e 0  0.690121  0.686890 -1.566688  0.904974
  1  0.778822  0.428233  0.108872  0.028284
  2 -0.578826 -1.199451 -1.705952  0.369164
  3  1.876573 -0.376903  1.831936  0.003017
  4 -0.076023  0.003958 -0.185014 -2.487152
f 0 -1.704651 -1.136261 -2.973315  0.033317
  1 -0.248889 -0.450176  0.132428  0.022214
  2  0.317368 -0.752414 -1.296392  0.095139
  3 -0.423715 -1.185984 -0.365462 -1.271023
  4  1.586171  0.693391 -1.958081 -0.134801

p1 = df.to_panel()
print (p1)
<class 'pandas.core.panel.Panel'>
Dimensions: 4 (items) x 6 (major_axis) x 5 (minor_axis)
Items axis: 0 to 3
Major_axis axis: a to f
Minor_axis axis: 0 to 4

编辑1:

如果需要 MultiIndex DataFrame 可以为唯一值创建辅助范围，使用 concat 并最后删除 MultiIndex 的辅助级别:

np.random.seed(100)
raw_sample = []
labels = [1,1,1,2,2,2]
mux = pd.MultiIndex.from_arrays([labels, range(len(labels))])

samples = np.random.randn(6, 5, 4)
for contents in range(samples.shape[0]):
    raw_sample.append(pd.DataFrame(samples[contents]))

df = pd.concat(raw_sample, keys=mux)

df = df.reset_index(level=1, drop=True)
print (df)
            0         1         2         3
1 0 -1.749765  0.342680  1.153036 -0.252436
  1  0.981321  0.514219  0.221180 -1.070043
  2 -0.189496  0.255001 -0.458027  0.435163
  3 -0.583595  0.816847  0.672721 -0.104411
  4 -0.531280  1.029733 -0.438136 -1.118318
  0  1.618982  1.541605 -0.251879 -0.842436
  1  0.184519  0.937082  0.731000  1.361556
  2 -0.326238  0.055676  0.222400 -1.443217
  3 -0.756352  0.816454  0.750445 -0.455947
  4  1.189622 -1.690617 -1.356399 -1.232435
  0 -0.544439 -0.668172  0.007315 -0.612939
  1  1.299748 -1.733096 -0.983310  0.357508
  2 -1.613579  1.470714 -1.188018 -0.549746
  3 -0.940046 -0.827932  0.108863  0.507810
  4 -0.862227  1.249470 -0.079611 -0.889731
2 0 -0.881798  0.018639  0.237845  0.013549
  1 -1.635529 -1.044210  0.613039  0.736205
  2  1.026921 -1.432191 -1.841188  0.366093
  3 -0.331777 -0.689218  2.034608 -0.550714
  4  0.750453 -1.306992  0.580573 -1.104523
  0  0.690121  0.686890 -1.566688  0.904974
  1  0.778822  0.428233  0.108872  0.028284
  2 -0.578826 -1.199451 -1.705952  0.369164
  3  1.876573 -0.376903  1.831936  0.003017
  4 -0.076023  0.003958 -0.185014 -2.487152
  0 -1.704651 -1.136261 -2.973315  0.033317
  1 -0.248889 -0.450176  0.132428  0.022214
  2  0.317368 -0.752414 -1.296392  0.095139
  3 -0.423715 -1.185984 -0.365462 -1.271023
  4  1.586171  0.693391 -1.958081 -0.134801

但是创建面板是不可能的:

p1 = df.to_panel()
print (p1)

>ValueError: Can't convert non-uniquely indexed DataFrame to Panel

关于python - 将 2D Panda 的 DataFrame 列表转换为 3D DataFrame，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43361791/

文章推荐： javascript - Ember 不会根据另一个属性更新 <input text> 的值

文章推荐： html - 在元素中水平和垂直居中文本

c++ - 将迭代器存储到字符串中(转换、转换、追加？)
我正在尝试将一个字符串逐个字符地复制到另一个字符串中。目的不是复制整个字符串，而是复制其中的一部分(我稍后会为此做一些条件......) 但我不知道如何使用迭代器。你能帮帮我吗？ std::stri
C++:转换/转换 void 指针到结构引用
我想将 void 指针转换为结构引用。结构的最小示例: #include "Interface.h" class Foo { public: Foo() : mAddress((uint
javascript - 为什么一个元素从窗口的左上角开始它的 css3 转换/转换？
这有点烦人:我有一个 div，它从窗口的左上角开始过渡，即使它位于文档的其他任何位置。我试过 usign -webkit-transform-origin 但没有成功，也许我用错了。有人可以帮助我吗？
html - 有什么方法可以检测 CSS3 转换/转换/动画的过程状态？
假设，如果将 CSS3 转换/转换/动画分配给 DOM 元素，我是否可以检测到该过程的状态？我想这样做的原因是因为我正在寻找类似过渡链的东西，例如，在前一个过渡之后运行一个过渡。最佳答案我在 h
CSS 转换/转换 - 谷歌浏览器中的 "shaky"图像
最近我遇到了“不稳定”屏幕，这很可能是由 CSS 转换引起的。事实上，它只发生在 Chrome 浏览器上(可能还有 Safari，因为一些人也报告了它)。知道如何让它看起来光滑吗？此外，您可能会注意
jquery - CSS3 转换(转换)在 Firefox 中不起作用，但在 Chrome 和 Safari 中起作用
我正在开发一个简单的 slider ，它使用 CSS 过渡来为幻灯片设置动画。我用一些基本样式和一些 javascript 创建了一支笔 here .注意:由于 Codepen 使用 Prefixfr
Linq 转换
我正在使用以下代码返回 IList: public IList FindCodesByCountry(string country) { var query =
转换、计算的RESTful设计
如何设计像这样的操作: 计算转化翻译例如:从“EUR”转换为“CNY”金额“100”。这是 /convert?from=EUR&to=CNY&amount=100 RESTful 吗？最佳答
Jquery 转换
我使用 jquery 组合了一个图像滚动器，如下所示 function rotateImages(whichHolder, start) { var images = $('#' +which
CSS 转换
如何使用 CSS (-moz-transform) 更改一个如下所示的 div: 最佳答案你可以看看Mozilla Developer Center .甚至还有例子。但是，在我看来，您的具体示例不
CSS 转换
我需要帮助我正在尝试在选中和未选中的汉堡菜单上实现动画。我能够为菜单设置动画，但我不知道如何在转换为 0 时为左菜单动画设置动画 &__menu { transform: translateX(
swift :转换
我正在为字典格式之间的转换而苦苦挣扎:我正在尝试将下面的项目数组转换为下面的结果数组。本质上是通过在项目第一个元素中查找重复项，然后仅在第一个参数不同时才将文件添加到结果集中。 var items:[
具有相同布局的不同类型之间的C++转换
如果我有两个定义相同的结构，那么在它们之间进行转换的最佳方式是什么？ struct A { int i; float f; }; struct B { int i; float f; }; void
Javascript 转换
我编写了一个 javascript 代码，可以将视口(viewport)从一个链接滑动到另一个链接。基本上一切正常，你怎么能在那里看到http://jsfiddle.net/DruwJ/8/ 我现在的
meteorjs 图像上传/转换
我需要将文件上传到 meteor ，对其进行一些图像处理(必要时进行图像转换，从图像生成缩略图)，然后将其存储在外部图像存储服务器(s3)中。这应该尽可能快。您对 nodejs 图像处理库有什么建议
KDB+，转换，左操作数
刚开始接触KDB+，有一些问题很难从Q for Mortals中得到。说，这里 http://code.kx.com/wiki/JB:QforMortals2/casting_and_enumera
JSF float 转换
我在这里的一个项目中使用 JSF 1.2 和 IceFaces 1.8。我有一个页面，它基本上是一大堆浮点数字段的大编辑网格。这是通过 inputText 实现的页面上的字段指向具有原始值的值对象
SceneKit 转换 ScnMatrix4
ScnMatrix4 是一个 4x4 矩阵。我的问题是什么矩阵行对应于位置(ScnVector3)，旋转(ScnVector4)，比例(ScnVector3)。第 4 行是空的吗？编辑: 我玩弄了
Scala map 转换
恐怕我是 Scala 新手: 我正在尝试根据一些简单的逻辑将 Map 转换为新 Map: val postVals = Map("test" -> "testing1", "test2" -> "te
基于配置文件的 XSLT 转换
输入: This is sample 1 This is sample 2 输出: ~COLOR~[Green]This is sample 1~COLOR~[Red]This is sam

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 将 2D Panda 的 DataFrame 列表转换为 3D DataFrame