gpt4 book ai didi

python - Pyspark 将 RowMatrix 转换为 DataFrame 或 RDD

转载 作者:行者123 更新时间:2023-11-28 17:22:39 26 4
gpt4 key购买 nike

我有一个方形的 pyspark RowMatrix,如下所示:

>>> row_mat.numRows()
100
>>> row_mat.numCols()
100
>>> row_mat.rows.first()
SparseVector(100, {0: 0.0, 1: 0.0018, 2: 0.1562, 3: 0.0342...})

我想运行 pyspark.ml.feature.PCA , 但它的 fit()方法只接受一个 DataFrame。有没有办法将此 RowMatrix 转换为 DataFrame

或者有更好的方法吗?

最佳答案

使用:

row_mat.rows.map(lambda x: (x, )).toDF()

关于python - Pyspark 将 RowMatrix 转换为 DataFrame 或 RDD,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40659109/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com