python - 将字典的 numpy ndarray 转换为 DataFrame-6ren

python - 将字典的 numpy ndarray 转换为 DataFrame

转载作者：行者123 更新时间：2023-12-01 06:31:21

25

4

我已经在 stackoverflow 上搜索了此问题的解决方案 -> 但所有解决方案都与我的需求略有不同。

我有一个很大的 ndarray(大约 1.07 亿行)，我们称之为 df:

    [{'A': 5, 'C': 3, 'D': 3},
     {'A': 7, 'B': 9, 'F': 5},
     {'B': 4, 'C': 7, 'E': 6}]

我需要将其尽可能高效地转换为 DataFrame。这是所需输出的示例:

     A    B    C    D    E    F
0  5.0  NaN  3.0  3.0  NaN  NaN
1  7.0  9.0  NaN  NaN  NaN  5.0
2  NaN  4.0  7.0  NaN  6.0  NaN

我尝试过 pd.DataFrame(df) 和 pd.DataFrame.from_dict(df) 但这些给了我输出:

     0
0  {'A': 5, 'C': 3, 'D': 3}
1  {'A': 7, 'B': 9, 'F': 5}
2  {'B': 4, 'C': 7, 'E': 6}

问题:如何将 df 转换为所需的输出？

编辑:

我尝试过anky_91的解决方案。这适用于列表 - 而不是 ndarray。我想避免转换为列表，因为列表中包含 1.07 亿个值会导致内存错误。

pd.DataFrame(df).sort_index(axis=1)

这仍然给我提供与 pd.DataFrame(df) 相同的输出。它输出一个包含一列且每行都有字典的 DataFrame。

最佳答案

我认为输入数据不同:

L =  [[{'A': 5, 'C': 3, 'D': 3}],
     [{'A': 7, 'B': 9, 'F': 5}],
     [{'B': 4, 'C': 7, 'E': 6}]]

print (pd.DataFrame(L))
                          0
0  {'A': 5, 'C': 3, 'D': 3}
1  {'A': 7, 'B': 9, 'F': 5}
2  {'B': 4, 'C': 7, 'E': 6}

可能的解决方案是扁平化:

from  itertools import chain
df = pd.DataFrame(chain.from_iterable(L)).sort_index(axis=1)
print (df)
     A    B    C    D    E    F
0  5.0  NaN  3.0  3.0  NaN  NaN
1  7.0  9.0  NaN  NaN  NaN  5.0
2  NaN  4.0  7.0  NaN  6.0  NaN

如果输入数据是numpy数组，则使用@Code不同注释中的解决方案:

arr = np.array([{'A': 5, 'C': 3, 'D': 3},
                {'A': 7, 'B': 9, 'F': 5},
                {'B': 4, 'C': 7, 'E': 6}])

df = pd.DataFrame(arr.tolist()).sort_index(axis=1)
print (df)
     A    B    C    D    E    F
0  5.0  NaN  3.0  3.0  NaN  NaN
1  7.0  9.0  NaN  NaN  NaN  5.0
2  NaN  4.0  7.0  NaN  6.0  NaN

关于python - 将字典的 numpy ndarray 转换为 DataFrame，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59898422/

25

4

0

文章推荐： java - 从 Android 中的 EditText 检索数据？

文章推荐： java - 如何查找对象数组是否包含某个元素？

文章推荐： jQuery替换元素id，但稍后无法识别

python - 如何将一维 ndarray 列表转换为二维 ndarray (mxnet ndarray)
在这个例子中，我有一个一维 ndarray 列表，长度为 9，列表有 9 个元素，每个元素有 shape=(2048,) ，所以完全9 * (2048,) , 我得到这些 ndarray来自 mxne
python - NumPy ndarray.all() vs np.all(ndarray) vs all(ndarray)
Python/NumPy 中的三种“全部”方法有什么区别？性能差异的原因是什么？ ndarray.all() 是否总是三者中最快的？这是我运行的计时测试: In [59]: a = np.full(
python - `ndarray.flags[' OWNDATA' ]`, ` ndarray.base`、 `id(ndarray)` 和 `ndarray.__array_interface__[' data']` 有什么不同？
我似乎在 this 中遇到了 XY 问题关于如何判断数组是否共享相同内存的问题。我检查的方式是错误的，我不知道为什么。举几个例子 test = np.ones((3,3)) test2 = np.a
python - MXNET - 数据类型 '' 无效，应为 NDArray、numpy.ndarray、
我在使用 mxnet 进行基本 IO 方面遇到问题。我正在尝试使用 mxnet.io.NDArrayIter 读取内存数据集以在 mxnet 中进行训练。我有下面的代码(为了简洁而精简)，它预处理代码
python - Numpy:需要最有效的方法来处理 1D ndarray 中的选择元素，使用 2D ndarray 的映射，以输出 1D 平均 ndarray
首先，这不是作业问题；而是作业问题。它是与我的工作相关的实际问题的抽象。我真的很感谢所有的意见! 我需要运行类似于下面的计算，按顺序运行数万次，它的计算时间显着影响我的模拟的总持续时间: 在这个抽象中
python - 根据坐标列表从 ndarray 构造一个 ndarray
这个问题在这里已经有了答案: Index multidimensional array with index array (1 个回答) 关闭 2 年前。我想根据一些坐标从 src ndarray
numpy-ndarray - 如何将索引相关函数应用于 numpy ndarray？
因此 numpy ndarray 非常方便，因为您只需为任何一维函数 f 和任何 ndarray A 输入 f(A) 即可，它将按元素应用 f。有人告诉我，这也是将函数应用于 ndarray 并避免
python - 将 ndarray 字符串转换为 ndarray
我有一个 ndarray 字符串。我想将它转换回 ndarray。我尝试了 newval = np.fromstring(val, dtype=float) 。但它给出了ValueError:字符串大
python - 如何用另一个 ndarray 索引一个 ndarray ？
我正在 python/numpy 中做一些机器学习工作，其中我想用一维 ndarray 索引一个二维 ndarray，这样我就可以得到一个带有索引值的一维数组。我让它与一些丑陋的代码一起工作，我想知
python - 使用索引数组从任意维的 ndarray 中提取 2d ndarray
我想根据某些维度的索引位置数组提取 numpy ndarray 的一部分。让我用一个例子来说明这一点示例数据 dummy = np.random.rand(5,2,100) X = np.array
python - 如何在另一个 ndarray 中找到一个 ndarray 的索引
这个问题在这里已经有了答案: Find the row indexes of several values in a numpy array (8 个答案) 关闭 2 年前。我有 a = np.a
Python:如何将 ndarray 转换为 ndarray 列表
我想提取 numpy.ndarray 的第一个轴成为numpy.ndarray的列表. 例如，arr_A包含形状为 (3, 100, 200) 的 numpy ndarray，它将转换为形状为 (10
python - 将数组的数组转换为 NumPy 的 ndarray of ndarrays
我一直在尝试用 ndarrays 的 numpy ndarray 转换数组数组。这是我的数据类型: dt = 'i8,i8,i8,i8,i8,i8,i8,i8,i8,i8,i8,i8,i8,f8,i
python - 用于将 ndarray 拆分为更小的重叠 ndarray 的滑动窗口
我目前正在研究一种可以拆分 numpy.ndarray 的方法进入给定数量的子阵列，只要该数量小于窗口移动的轴。示例: 给定一个形状为 (15, 40, 3) 的 numpy.ndarray 我想分
python - 查找落在另一个 ndarray 中的 ndarray 的点
我用 arcpy 模块创建了一个 NumPy 结构化数组(称为 arr): arr = arcpy.da.FeatureClassToNumPyArray('MPtest','SHAPE@XYZ',e
python - 引用 ndarray 中的 ndarray 行
是否可以将一个 numpy 数组的特定行的引用存储在另一个 numpy 数组中？我有一个二维节点数组，例如 nodes = np.array([[1, 2], [2, 3], [3, 4], [4,
python - 将两个系列合并/压缩到 ndarray 的 ndarray
我有两个长度相同的 pandas 系列，如下所示: S1 = 0 -0.483415 1 -0.514082 2 -0.515724 3 -0.519375 4
python - 从之前的 ndarray.tobytes() 转换回 ndarray？
当使用 numpy 时，假设我有一个任意的、以前创建的名为 my_ndarray 的 ndarray。如果可能的话，我希望能够执行以下操作...... my_bytes = my_ndarray.to
python - 为什么从一个 ndarray 复制到另一个 ndarray 内存消耗？
我在尝试使用 numpy 打乱多维数组时遇到问题。可以使用以下代码重现该问题: import numpy as np s=(300000, 3000) n=s[0] print ("Allocate"
python - 'numpy.ndarray' 对象如何不 'numpy.ndarray' 对象？
当您调用 DataFrame.to_numpy() 时，pandas 将找到可以容纳 DataFrame 中所有数据类型的 NumPy 数据类型。但是如何进行反向操作呢？我有一个“numpy.nda

首页

博学

6Ren·AI

商城

python - 将字典的 numpy ndarray 转换为 DataFrame