gpt4 book ai didi

python - JupyterLab/Python/Pandas - 比较两个数据帧

转载 作者:行者123 更新时间:2023-12-04 10:10:06 27 4
gpt4 key购买 nike

我正在尝试导入两个文件并比较 df1(按状态划分的数据)中的值计数和 df2 中该状态的连续数字。

换句话说,在一个 Excel 文件中,我有如下内容:

State      Food
Arizona Bananas
Arizona Pears
Arizona Pickles
Connecticut Potatoes
Connecticut Apples

等等。

所以从那里我对状态出现的次数感兴趣,值计数。

在另一个文件中,我有一列包含 50 个州和一个数字。

我想要做的基本上是创建一个数据框,按状态显示所述状态出现在 df1 中的次数(所以这里亚利桑那州将是 3)除以第二个数据框中与亚利桑那州对应的列中的数字。那有意义吗?

第二个数据框包含每个州的总人口,因此上述 3/n 的输出将是人均水果。

最佳答案

以下将起作用

import numpy as np
import pandas as pd

df1 = pd.DataFrame({'state': ['Arizona', 'Arizona', 'Arizona',
'Connecticut', 'Connecticut'],
'food': ['Bananas', 'Pears', 'Pickles', 'Potatoes', 'Apples']})
df2 = pd.DataFrame({'state':['Arizona', 'Connecticut'],
'population': [7300000, 3565000 ]})

df1 = df1.groupby('state').count().merge(df2.set_index('state'),
how = 'left', left_index = True, right_index = True)
df1['result'] = df1['food']/df1['population']
df1


food population result
state
Arizona 3 7300000 4.109589e-07
Connecticut 2 3565000 5.610098e-07

关于python - JupyterLab/Python/Pandas - 比较两个数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61372278/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com