gpt4 book ai didi

python - 将数据保存到pandas中的多个csv文件中

转载 作者:行者123 更新时间:2023-12-02 02:44:13 25 4
gpt4 key购买 nike

我从 .gov 网站获得了以下数据:

import pandas as pd
import io
import requests
url="https://download.bls.gov/pub/time.series/la/la.data.64.County"
s=requests.get(url).content
c=pd.read_csv(io.StringIO(s.decode('utf-8')))

行数是 4942096。我想将所有这些放入多个 csv 文件中。

我知道如何获得第一百万:

c.to_csv('nick.csv', index = False, chunksize = 1000000)

如何获得其余部分?

最佳答案

您可以循环遍历文件并将其保存为:

filename = io.StringIO(s.decode('utf-8'))
# ^ not tested this but assuming it would work for readability sake.

chunk_size = 10 ** 6
for chunk in pd.read_csv(filename, chunksize=chunk_size):
chunk.to_csv('nick.csv.gz',compression='gzip',index=False)

您需要添加某种命名约定,否则您将覆盖该文件。我还添加了 gzip 压缩,这显着加快了写入时间。

我只是个人添加一个计数器

chunk_size = 10 ** 6
counter = 0
for chunk in pd.read_csv(filename, chunksize=chunk_size):
counter = counter + 1
chunk.to_csv(f'nick_{str(counter)}.csv.gz',compression='gzip',index=False)

关于python - 将数据保存到pandas中的多个csv文件中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57965540/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com