gpt4 book ai didi

python - 从现有数据框的某些列创建新的 Pandas 数据框

转载 作者:太空狗 更新时间:2023-10-29 20:23:41 25 4
gpt4 key购买 nike

我已阅读将 csv 文件加载到 pandas 数据框中,并想对该数据框进行一些简单的操作。我不知道如何根据原始数据框中的选定列创建新的数据框。我的尝试:

names = ['A','B','C','D']
dataset = pandas.read_csv('file.csv', names=names)
new_dataset = dataset['A','D']

我想用原始数据框中的 A 列和 D 列创建一个新数据框。

最佳答案

它被称为 subset - 在 [] 中传递的列列表:

dataset = pandas.read_csv('file.csv', names=names)

new_dataset = dataset[['A','D']]

什么是相同的:

new_dataset = dataset.loc[:, ['A','D']]

如果只需要过滤输出添加参数usecolsread_csv :

new_dataset = pandas.read_csv('file.csv', names=names, usecols=['A','D'])

编辑:

如果仅使用:

new_dataset = dataset[['A','D']]

并使用一些数据操作,显然得到:

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

如果稍后修改 new_dataset 中的值,您会发现修改不会传播回原始数据(dataset),并且 Pandas 会发出警告。

正如指出的那样EdChum添加copy删除警告:

new_dataset = dataset[['A','D']].copy()

关于python - 从现有数据框的某些列创建新的 Pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45035929/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com