python - Pandas to_hdf() TypeError : object of type 'int' has no len()-6ren

python - Pandas to_hdf() TypeError : object of type 'int' has no len()

转载作者：行者123 更新时间：2023-12-04 03:33:56

28

4

我想存储一个 pandas DataFrame，这样当我稍后再次加载它时，我只加载它的某些列而不是整个东西。因此，我试图以 hdf 格式存储 pandas DataFrame。 DataFrame 包含一个 numpy 数组，我收到以下错误消息。

关于如何消除错误或我可以使用什么格式的任何想法？

代码:

import pandas as pd
import numpy as np

df = pd.DataFrame({"a": [1,2,3,4], "b": [1,2,3,4]})
df["c"] = [np.ones((4,4)) for i in range(4)]
df.to_hdf("test.h5", "df", format='table', data_columns=True)

错误:

TypeError                                 Traceback (most recent call last)
<ipython-input-2-ace42e5ccbb7> in <module>
----> 1 df.to_hdf("test.h5", "df", format='table', data_columns=True)

/opt/conda/lib/python3.7/site-packages/pandas/core/generic.py in to_hdf(self, path_or_buf, key, mode, complevel, complib, append, format, index, min_itemsize, nan_rep, dropna, data_columns, errors, encoding)
   2619             data_columns=data_columns,
   2620             errors=errors,
-> 2621             encoding=encoding,
   2622         )
   2623 

/opt/conda/lib/python3.7/site-packages/pandas/io/pytables.py in to_hdf(path_or_buf, key, value, mode, complevel, complib, append, format, index, min_itemsize, nan_rep, dropna, data_columns, errors, encoding)
    278             path_or_buf, mode=mode, complevel=complevel, complib=complib
    279         ) as store:
--> 280             f(store)
    281     else:
    282         f(path_or_buf)

/opt/conda/lib/python3.7/site-packages/pandas/io/pytables.py in <lambda>(store)
    270             errors=errors,
    271             encoding=encoding,
--> 272             dropna=dropna,
    273         )
    274 

/opt/conda/lib/python3.7/site-packages/pandas/io/pytables.py in put(self, key, value, format, index, append, complib, complevel, min_itemsize, nan_rep, data_columns, encoding, errors, track_times, dropna)
   1104             errors=errors,
   1105             track_times=track_times,
-> 1106             dropna=dropna,
   1107         )
   1108 

/opt/conda/lib/python3.7/site-packages/pandas/io/pytables.py in _write_to_group(self, key, value, format, axes, index, append, complib, complevel, fletcher32, min_itemsize, chunksize, expectedrows, dropna, nan_rep, data_columns, encoding, errors, track_times)
   1753             nan_rep=nan_rep,
   1754             data_columns=data_columns,
-> 1755             track_times=track_times,
   1756         )
   1757 

/opt/conda/lib/python3.7/site-packages/pandas/io/pytables.py in write(self, obj, axes, append, complib, complevel, fletcher32, min_itemsize, chunksize, expectedrows, dropna, nan_rep, data_columns, track_times)
   4222             min_itemsize=min_itemsize,
   4223             nan_rep=nan_rep,
-> 4224             data_columns=data_columns,
   4225         )
   4226 

/opt/conda/lib/python3.7/site-packages/pandas/io/pytables.py in _create_axes(self, axes, obj, validate, nan_rep, data_columns, min_itemsize)
   3892                 nan_rep=nan_rep,
   3893                 encoding=self.encoding,
-> 3894                 errors=self.errors,
   3895             )
   3896             adj_name = _maybe_adjust_name(new_name, self.version)

/opt/conda/lib/python3.7/site-packages/pandas/io/pytables.py in _maybe_convert_for_string_atom(name, block, existing_col, min_itemsize, nan_rep, encoding, errors)
   4885         # we cannot serialize this data, so report an exception on a column
   4886         # by column basis
-> 4887         for i in range(len(block.shape[0])):
   4888             col = block.iget(i)
   4889             inferred_type = lib.infer_dtype(col, skipna=False)

TypeError: object of type 'int' has no len()

最佳答案

Pandas 似乎无法序列化数据框中的 numpy 数组。所以我建议将 numpy 数据存储在单独的 *.h5 文件中。

import pandas as pd
import numpy as np
import h5py

df = pd.DataFrame({"a": [1,2,3,4], "b": [1,2,3,4]})
df.to_hdf("pandas_data.h5", "df", format='table', data_columns=True)

c =  [np.ones((4,4)) for i in range(4)]
with h5py.File('numpy_data.h5', 'w') as hf:
    hf.create_dataset('dataset_1', data=c)

然后您可以使用以下方法加载该数据:'

with h5py.File('numpy_data.h5', 'r') as hf:
    c_out = hf['dataset_1'][:]

df = pd.read_hdf('pandas_data.h5', 'df')
df['c'] = list(c_out)

关于python - Pandas to_hdf() TypeError : object of type 'int' has no len()，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67308374/

28

4

0

文章推荐： powerbi - Snowflake 和 OLAP 解决方案

文章推荐： node.js - Azure 静态 Web 应用程序 NodeJS 环境变量

文章推荐： c# - csc.exe 可以强制遵守特定的 .net 标准吗？

文章推荐： python - 404 HTTP 错误，尽管能够在浏览器中看到该页面

haskell - 将 Lens 组合成元组的 Lens
给定 data Person = Person { _name :: String } makeClassy ''Person 它创建了一个 name :: Lens' Person String 我
Cost of len() function(Len()函数的开销)
Python内置的len()函数的成本是多少？(列表/元组/字符串/词典)
haskell - Data.Lens 或 Control.Lens
这个问题在这里已经有了答案: 9年前关闭。 Possible Duplicate: lenses, fclabels, data-accessor - which library for struct
python - 哪个性能更好 : len(a[:-1]) or len(a)-1
Python 哪个性能更好: 1) for i in range(len(a[:-1])): foo() 或 2) for i in range(len(a)-1): foo() 更新
python :不明白 "while len(list1) and len(list2):"
我正在学习 Python 并正在学习谷歌代码类(class)。在 list2.py 示例中，他们要求我们编写一个函数: Given two lists sorted in increasing ord
python - Len 和 Print Len() 的区别
我最近开始使用 Python 进行数据分析，由于我不是从头开始学习 Python，所以我觉得我错过了一些细微差别。我注意到的一件事是，在我的一份报告中，我从 CSV 文件中导入了一个数据集，将其作为
python - a[len(a) :] = [x] and a[len(a)] = [x] 之间的区别
为什么a[len(a):] = [x]等同于a.append(x)，但是a[len(a) ] = [x] 给出超出范围的错误？最佳答案根据 the documentation (强调我的): If
vba - 为什么 Len 和 VBA.Len 返回不同的结果？
当我运行以下宏时: Sub try() Dim num As Integer num = 123 MsgBox Len(num) MsgBox VBA.Len(num)
python - 在随机 len 的数字字符串后删除随机 len 的 0
我目前正在获取 Python 3.x 中以 0 的随机长度结尾的随机数列表。例如，我得到以下一组随机数字字符串: String 1 = 203502000000 String 2 = 30293300
python - Numba jitted len() 比纯 Python len() 慢
我正在学习 numba 并遇到了这种我不理解的“奇怪”行为。我尝试使用以下代码(在 iPython 中，用于计时): import numpy as np import numba as nb @nb
go - len(字符串) == 0 或 len(字符串) < 1
在Go , 要检查字符串是否为空，可以使用: len(str) == 0 或 len(str) < 1 或 str == "" 基本上就是选择运营商的一米== , < , != ，但就性能而言希望选项
type-inference - 统一 len 和 S len 会带来无限的值(value)
我正在尝试创建一个函数 hpure通过重复相同的元素直到达到所需的长度来生成 hvect。每个元素可能有不同的类型。例如:如果参数是 show 每个元素将是 show 函数的特化。 hpure sho
python - 在计算 networkx 中的传出和传入边缘时，len 抛出 'dict_keyiterator' 没有 len()
我正在实现一个图形操作脚本，但我对以下错误感到困惑: Traceback (most recent call last): File ".....py", line 12, in pri
python - 使用 n = len(s) 而不是直接使用 len(s) 是否更快？
通常为了节省一些时间，我希望我们在本地函数中使用 n = len(s)。我很好奇哪个调用更快或者它们相同？ while i < len(s): # do something 对比 while i
python - 为什么在 python 中使用 len(list) 而不是 list.len()？
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
JavaScript 数组 while 循环。比较结果: arr[len] vs arr[len-1]
大家好! 我从这个网站找到了这段很棒的代码: var points = [30,100]; document.getElementById("demo").innerHTML = myArrayMax
python - len 没有很好地定义符号。请调用 `x.shape` 而不是 `len(x)` 获取形状信息
我有一个输出 17 个维度的解码器，其中不同部分是标签和数字。因此，对于标签，我使用了 one-hot 编码并使用“softmax”激活，对于数字，我使用了“sigmoid”激活函数。这是解码器:
python-3.x - 为什么这个 python 函数返回 len=7 而不是 len=6？
我在下面得到了这段代码，但即使调试它，我也不明白为什么给出 7 而不是 6。更准确地说，当我调试每个返回时都会给我预期的结果: 第一个函数调用:ipdb> --Return-- ['a'] 第二个函
char ** array = malloc(sizeof(char*)*len) vs malloc(sizeof(char)*len)
上述分配可能会出现什么样的问题？如果我们分配实际数据类型的大小而不是该类型指针的大小？对于 sizeof (char*) > sizeof (char) 的字符来说，这会是一个问题吗？其他数据类型和
python - 为什么 somelist[len(somelist)] 生成一个 IndexError 而不是 somelist[len(somelist) :]?
我知道 somelist[len(somelist)] 无法访问定义列表之外的索引 - 这是有道理的。但是为什么 Python 允许你做 somelist[len(somelist):]？我什至读

首页

博学

6Ren·AI

商城

python - Pandas to_hdf() TypeError : object of type 'int' has no len()