gpt4 book ai didi

apache-spark - pyspark 错误 : 'DataFrame' object has no attribute 'map'

转载 作者:行者123 更新时间:2023-12-03 09:47:48 25 4
gpt4 key购买 nike

我正在使用 pyspark 2.0 通过使用以下方法读取 csv 来创建 DataFrame 对象:

data = spark.read.csv('data.csv', header=True)

我找到了使用的数据类型
type(data)

结果是
pyspark.sql.dataframe.DataFrame

我正在尝试将数据中的某些列转换为 LabeledPoint 以应用分类。
from pyspark.sql.types import *    
from pyspark.sql.functions import loc
from pyspark.mllib.regression import LabeledPoint

data.select(['label','features']).
map(lambda row:LabeledPoint(row.label, row.features))

我遇到了这个问题:
AttributeError: 'DataFrame' object has no attribute 'map'

关于错误的任何想法?有没有办法从 DataFrame 生成 LabelPoint 以执行分类?

最佳答案

使用 .rdd.map :

>>> data.select(...).rdd.map(...)
DataFrame.map已在 Spark 2 中删除。

关于apache-spark - pyspark 错误 : 'DataFrame' object has no attribute 'map' ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39381245/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com