gpt4 book ai didi

python - 如何遍历 DataFrame 行并从 cols 中的字典中获取值?

转载 作者:太空宇宙 更新时间:2023-11-04 04:26:58 25 4
gpt4 key购买 nike

Features_Frame

每个特征框将是一批数据。我想提取 col 几何中关键“坐标”的所有值,并迭代插入到另一个 df 中。

使用相同的 df,我还想存储从属性 col 中提取的数据。 Properties col 有很多键。

每个源帧都有'geometry':'coordinates' 和'properties',它们由各种键组成。

这个新 DataFrame 中的每个列都将是“几何”或“属性”中的键。

例如:

      coordinates          name
0 [-108.600,39.09] 'Target'
1 [51.459,82.04] 'Costco'
2 [-35.459,82.04] 'BJ's Wholesale Club'
3 [98.459,12.07] 'Walgreens'
4 [105.404,96.04] 'Walmart

我可以通过以下方式访问这两个列:

coord_frame = features_frame['geometry'][:]
properties_frame = features_frame['properties'][:]

但这只会将框架一分为二。通常,如果我这样做了:

Feature_Frame['geometry'][:]['coordinates']

如果这样做的话,我会在所有行的几何列中获取坐标键的值:

Feature_Frame['properties'][:]['name']

我会在所有行的属性列中获取名称键的值。

相反,我只是收到一个关键错误,指出名称或坐标不存在。

最佳答案

将字典列表提供给 pd.DataFrame 构造函数

pd.Series.apply 是一个 Python 级别的循环,除了它通常表现不佳 简单的列表理解。一个更好的主意是使用 pd.DataFrame 构造函数中使用的优化代码。这是一个例子:

df = pd.DataFrame({'geometry': [{'coordinates': [-108.600,39.09], 'name': 'Target'},
{'coordinates': [51.459,82.04], 'name': 'Costco'}]})

print(df)

geometry
0 {'coordinates': [-108.6, 39.09], 'name': 'Targ...
1 {'coordinates': [51.459, 82.04], 'name': 'Cost...

res = pd.DataFrame(df['geometry'].values.tolist())

print(res)

coordinates name
0 [-108.6, 39.09] Target
1 [51.459, 82.04] Costco

对多系列词典使用concat

以上可以扩展到任意系列的字典:

df = pd.DataFrame({'geometry': [{'coordinates': [-108.600,39.09], 'name': 'Target'},
{'coordinates': [51.459,82.04], 'name': 'Costco'}],
'properties': [{'osm_id': 288700723, 'osm_tye': 'W'},
{'osm_id': 52734154, 'osm_tye': 'W'}]})

res = pd.concat((pd.DataFrame(df[col].values.tolist()) for col in df), axis=1)

print(res)

coordinates name osm_id osm_tye
0 [-108.6, 39.09] Target 288700723 W
1 [51.459, 82.04] Costco 52734154 W

关于python - 如何遍历 DataFrame 行并从 cols 中的字典中获取值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53313802/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com