gpt4 book ai didi

python - 从长数据绘制 Pandas 的数据透视表

转载 作者:太空宇宙 更新时间:2023-11-03 16:08:11 25 4
gpt4 key购买 nike

我有一个 xls 文件,其中的数据以长格式组织。我有四列:变量名称、国家/地区名称、年份和值。

使用 pandas.read_excel 在 Python 中导入数据后,我想绘制不同国家的一个变量的时间序列。为此,我创建了一个数据透视表,以宽格式转换数据。当我尝试使用 matplotlib 绘图时,出现错误

ValueError: could not convert string to float: 'ZAF'

(其中“ZAF”是一个国家/地区的标签)

有什么问题吗?

这是代码:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_excel('raw_emissions_energy.xls','raw data', index_col = None, thousands='.',parse_cols="A,C,F,M")

data['Year'] = data['Year'].astype(str)
data['COU'] = data['COU'].astype(str)

# generate sub-datasets for specific VARs

data_CO2PROD = pd.pivot_table(data[(data['VAR']=='CO2_PBPROD')], index='COU', columns='Year')

plt.plot(data_CO2PROD)

包含原始数据的 xls 文件如下所示: raw data Excel view

enter image description here

这是我从 data_CO2PROD.info() 得到的

<class 'pandas.core.frame.DataFrame'>
Index: 105 entries, ARE to ZAF
Data columns (total 16 columns):
(Value, 1990) 104 non-null float64
(Value, 1995) 105 non-null float64
(Value, 2000) 105 non-null float64
(Value, 2001) 105 non-null float64
(Value, 2002) 105 non-null float64
(Value, 2003) 105 non-null float64
(Value, 2004) 105 non-null float64
(Value, 2005) 105 non-null float64
(Value, 2006) 105 non-null float64
(Value, 2007) 105 non-null float64
(Value, 2008) 105 non-null float64
(Value, 2009) 105 non-null float64
(Value, 2010) 105 non-null float64
(Value, 2011) 105 non-null float64
(Value, 2012) 105 non-null float64
(Value, 2013) 105 non-null float64
dtypes: float64(16)
memory usage: 13.9+ KB
None

最佳答案

使用 data_CO2PROD.plot() 而不是 plt.plot(data_CO2PROD) 可以让我绘制数据。 http://pandas.pydata.org/pandas-docs/stable/visualization.html。简单代码:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

data= pd.DataFrame(np.random.randn(3,4), columns=['VAR','COU','Year','VAL'])
data['VAR'] = ['CC','CC','KK']
data['COU'] =['ZAF','NL','DK']
data['Year']=['1987','1987','2006']
data['VAL'] = [32,33,35]

data['Year'] = data['Year'].astype(str)
data['COU'] = data['COU'].astype(str)

# generate sub-datasets for specific VARs

data_CO2PROD = pd.pivot_table(data=data[(data['VAR']=='CC')], index='COU', columns='Year')
data_CO2PROD.plot()
plt.show()

关于python - 从长数据绘制 Pandas 的数据透视表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39561248/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com