gpt4 book ai didi

python - 将此数据读入 pandas 数据框的优雅方法?

转载 作者:太空宇宙 更新时间:2023-11-03 15:20:10 24 4
gpt4 key购买 nike

我正在查看此处发布的文本文件,因为我在任何地方都找不到更清晰的大气二氧化碳浓度历史记录表:

https://data.giss.nasa.gov/modelforce/ghgases/Fig1A.ext.txt

我试图弄清楚如何将该文件读入 pandas,而不必先进行尴尬的文本编辑器操作。有办法做到吗?

我在编辑器中执行此操作的方法是首先从文本文件中删除所有单词,然后使用 read_table 但我必须提供一些指令,使其按年份、ppm 的顺序解释数据、年份、ppm 等。我不知道该怎么做,也忍不住想知道是否有一种聪明的方法来读取原始文件,用 python 自动将有问题的单词识别为单词并忽略它们?

最佳答案

如果您使用pandas.read_fwf ,这相当简单:

代码:

df = pd.read_fwf(
'https://data.giss.nasa.gov/modelforce/ghgases/Fig1A.ext.txt',
header=None, skiprows=5, nrows=50,
colspecs=[( 8, 12), (14, 20), (28, 32), (34, 40),
(48, 52), (54, 60), (68, 72), (74, 80)])

years = np.concatenate([df[i].values for i in range(0, 8, 2)])
temps = np.concatenate([df[i].values for i in range(1, 8, 2)])
df = pd.DataFrame(temps, index=years, columns=['temps']).dropna()
print(df)

结果:

         temps
1850.0 285.20
1851.0 285.10
1852.0 285.00
1853.0 285.00
1854.0 284.90
... ...
2007.0 383.37
2008.0 385.46
2009.0 386.95
2010.0 389.21
2011.0 391.15

[162 rows x 1 columns]

关于python - 将此数据读入 pandas 数据框的优雅方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43598095/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com