gpt4 book ai didi

python - 在 pd.DataFrame 中插入一行而不加载文件

转载 作者:行者123 更新时间:2023-12-01 09:28:41 24 4
gpt4 key购买 nike

以下代码可以有效地在我的数据集中插入一行(特征名称)作为第一行:

features = ['VendorID', 'mta_tax', 'tip_amount', 'tolls_amount', 'improvement_surcharge', 'total_amount']

df = pd.DataFrame(pd.read_csv(path + 'data.csv', sep=','))
df.loc[-1] = features # adding a row
df.index = df.index + 1 # shifting index
df = df.sort_index() # sorting by index

但是 data.csv 非常大 ~ 10 GB,因此我想知道是否可以直接在文件中插入 features 行而不加载它!可能吗?

谢谢

最佳答案

您不必将整个文件加载到内存中,使用 stdlib csv 模块的 writer 功能将一行附加到文件末尾。

import csv
import os

with open(os.path.join(path, 'data.csv'), 'a') as f:
writer = csv.writer(f)
writer.writerow(features)

关于python - 在 pd.DataFrame 中插入一行而不加载文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50140506/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com