gpt4 book ai didi

python - 如何从 Graphlab 迁移到 pandas

转载 作者:行者123 更新时间:2023-12-01 02:56:11 24 4
gpt4 key购买 nike

我一直在学习 Graphlab,但也想看看 pandas,因为它是开源的,将来我可能会发现自己在一家没有 GL 许可证的公司,我想知道 pandas 如何可以像使用 GL 一样创建基本模型。

data = pd.read_csv("~/Downloads/diamonds.csv")
sframe = gl.SFrame(data)
train_data, test_data = sframe.random_split(.8, seed=1)
train, test = train_test_split(data, train_size=0.75, random_state=88)
reg_model = gl.linear_regression.create(train_data, target="price", features=["carat","cut","color"], validation_set=None)

上面最后一行的 pandas 等价物是什么?

最佳答案

pandas 本身没有任何内置的预测模型(据我所知)。 Here is a good link on how to leverage pandas在统计模型中。 This one too.

pandas 可能是 Python 中数据操作的最佳(如果不是最好)模块之一。与列表和读取 CSV 等相比,它将使存储数据和操作数据以进行建模变得更加容易。

读取文件就像这样简单(注意它是多么直观):

import pandas as pd
# Excel
df1 = read_excel(PATH_HERE)
# Csv
df1 = read_csv(PATH_HERE)
# JSON
df1 = read_json(PATH_HERE)

并吐出它:

# Excel
d1.to_excel(PATH_HERE)
# Need I go on again??

它还使过滤和切片数据变得非常简单。 Here is the official doc :

出于建模目的,请查看 sklearnNLTK用于文本分析。还有其他的,但这些是我用过的。

关于python - 如何从 Graphlab 迁移到 pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44209053/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com