gpt4 book ai didi

python - Pandas 的数据框(Python)是否更接近 R 的数据框或数据表?

转载 作者:太空狗 更新时间:2023-10-29 20:16:27 26 4
gpt4 key购买 nike

<分区>

要理解我的问题,我应该首先指出 R 数据表不仅仅是带有语法糖的 R 数据帧,还有重要的行为差异:数据表中通过引用进行列分配/修改避免了在内存中复制整个对象(请参阅 this quora answer 中的示例),因为它是数据帧中的情况。

我多次发现 data.table 的行为引起的速度和内存差异是一个关键因素,它允许人们处理一些大数据集,而它不会data.frame 的行为是可能的。

因此,我想知道的是:在 Python 中,Pandas 的数据帧在这方面的行为如何?

奖励问题:如果 Pandas 的数据帧比 R 数据表更接近 R 数据帧,并且具有相同的缺点(分配/修改列时对象的完整副本),是否有与 R 的 等效的 Python data.table 包 ?


根据评论请求编辑:代码示例:

R 数据框:

# renaming a column
colnames(mydataframe)[1] <- "new_column_name"

R 数据表:

# renaming a column
library(data.table)
setnames(mydatatable, 'old_column_name', 'new_column_name')

在 Pandas 中:

mydataframe.rename(columns = {'old_column_name': 'new_column_name'}, inplace=True)

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com