gpt4 book ai didi

python - 尊重 Pandas Dataframes 的 Python 中的扁平化(不规则)列表列表

转载 作者:行者123 更新时间:2023-11-30 23:28:45 29 4
gpt4 key购买 nike

这是 Stackoverflow 上的一个递归问题,但给出的解决方案 here仍然不完美。对我来说,屈服仍然是 python 中最复杂的东西之一,所以我不知道如何自己修复它。

当给定函数的任何列表中的项目是 Pandas 数据帧时,展平函数将返回其 header ,而不是数据帧本身。您可以通过运行以下代码来明确测试这一点:

import pandas
import collections
df = pandas.DataFrame(np.random.randn(100, 4), columns=list('ABCD'))

def flatten(l):
for el in l:
if isinstance(el, collections.Iterable) and not isinstance(el, basestring):
for sub in flatten(el):
yield sub
else:
yield el

然后,如果您调用引用的帖子中给出的函数:

list(flatten([df]))   #['A', 'B', 'C', 'D']

而不是返回一个包含数据框的列表。如何使函数扁平化并尊重数据帧?

最佳答案

如果元素是collections.Iterable的实例并且它不是一个字符串(它是可迭代的,但我们通常想要处理它),那么flatten函数将向下递归作为一个标量,我们不会深入研究)。

尽管 DataFramescollections.Iterable 的实例,但听起来您也希望它们成为终端。在这种情况下:

    if (isinstance(el, collections.Iterable) and 
not isinstance(el, (basestring, pandas.DataFrame))):

之后:

>>> list(flatten([[1,2], "2", df]))
[1, 2, '2', <class 'pandas.core.frame.DataFrame'>
Int64Index: 100 entries, 0 to 99
Data columns (total 4 columns):
A 100 non-null values
B 100 non-null values
C 100 non-null values
D 100 non-null values

关于python - 尊重 Pandas Dataframes 的 Python 中的扁平化(不规则)列表列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21461140/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com