gpt4 book ai didi

python - 在 Python 中重新格式化制表符分隔的数据

转载 作者:太空宇宙 更新时间:2023-11-04 02:34:13 24 4
gpt4 key购买 nike

我在 Excel 中有一些制表符分隔的数据需要重新格式化才能在 Tableau 中使用。这是它的样子:

State   2001    2002    2003    2004    2005    2006    2007
Alabama 5.6 5.71 5.88 6.08 6.46 7.07 7.57
Alaska 10.54 10.46 10.5 10.99 11.72 12.84 13.28
Arizona 7.27 7.21 7.34 7.45 7.79 8.24 8.54
Arkansas 6.05 5.61 5.57 5.67 6.3 6.99 6.96

这是我需要的样子:

State   Cost    Date
Alabama 5.6 12/31/2001
Alabama 5.71 12/31/2002
Alabama 5.88 12/31/2003
Alabama 6.08 12/31/2004
Alabama 6.46 12/31/2005
Alabama 7.07 12/31/2006
Alabama 7.57 12/31/2007
Alaska 10.54 12/31/2001
Alaska 10.46 12/31/2002
Alaska 10.5 12/31/2003
Alaska 10.99 12/31/2004
Alaska 11.72 12/31/2005
Alaska 12.84 12/31/2006
Alaska 13.28 12/31/2007
Arizona 7.27 12/31/2001
Arizona 7.21 12/31/2002
Arizona 7.34 12/31/2003
Arizona 7.45 12/31/2004
Arizona 7.79 12/31/2005
Arizona 8.24 12/31/2006
Arizona 8.54 12/31/2007
Arkansas 6.05 12/31/2001
Arkansas 5.61 12/31/2002
Arkansas 5.57 12/31/2003
Arkansas 5.67 12/31/2004
Arkansas 6.3 12/31/2005
Arkansas 6.99 12/31/2006
Arkansas 6.96 12/31/2007

在 Python 中实现此目的的最佳方法是什么?我熟悉 Numpy 和 Pandas,所以这些是选项,但我真正想要的只是让 Python 吐出重新格式化的数据,以便我可以轻松粘贴到 Excel 中。

最佳答案

在 Pandas 中我会这样做:

假设您有以下 DataFrame(从 Excel 读取):

In [99]: df
Out[99]:
State 2001 2002 2003 2004 2005 2006 2007
0 Alabama 5.60 5.71 5.88 6.08 6.46 7.07 7.57
1 Alaska 10.54 10.46 10.50 10.99 11.72 12.84 13.28
2 Arizona 7.27 7.21 7.34 7.45 7.79 8.24 8.54
3 Arkansas 6.05 5.61 5.57 5.67 6.30 6.99 6.96

解决方法:

In [102]: d = pd.melt(df, 'State', var_name='Date', value_name='Cost')

In [103]: d.assign(Date=pd.to_datetime(d['Date'])+pd.offsets.YearEnd())
Out[103]:
State Date Cost
0 Alabama 2001-12-31 5.60
1 Alaska 2001-12-31 10.54
2 Arizona 2001-12-31 7.27
3 Arkansas 2001-12-31 6.05
4 Alabama 2002-12-31 5.71
5 Alaska 2002-12-31 10.46
6 Arizona 2002-12-31 7.21
7 Arkansas 2002-12-31 5.61
8 Alabama 2003-12-31 5.88
9 Alaska 2003-12-31 10.50
.. ... ... ...
18 Arizona 2005-12-31 7.79
19 Arkansas 2005-12-31 6.30
20 Alabama 2006-12-31 7.07
21 Alaska 2006-12-31 12.84
22 Arizona 2006-12-31 8.24
23 Arkansas 2006-12-31 6.99
24 Alabama 2007-12-31 7.57
25 Alaska 2007-12-31 13.28
26 Arizona 2007-12-31 8.54
27 Arkansas 2007-12-31 6.96

[28 rows x 3 columns]

您还可以轻松地将其保存为 Excel 文件:

d.assign(Date=pd.to_datetime(d['Date'])+pd.offsets.YearEnd()) \
.to_excel(r'/path/to/output.xlsx', index=False)

关于python - 在 Python 中重新格式化制表符分隔的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48330460/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com