gpt4 book ai didi

r - MLlib : How does RFormula. fit() 工作吗?

转载 作者:行者123 更新时间:2023-11-30 09:19:27 24 4
gpt4 key购买 nike

使用 Spark 的 MLlib 创建模型的一种可能性是使用 pyspark.ml.feature 中的 RFormula 模块,如 docs 中所述。 。但是,我找不到任何解释 fit 在这种情况下是如何实际实现的。它使用平方损失函数还是其他函数?我在哪里可以找到此类信息? source确实很难理解...

最佳答案

正如 Anoop Toffy 的评论中提到的,您可以找到一个不错的小教程 here 。引用教程:

The fit() step determines the mapping of categorical feature values to vector indices in the output, so that the fitted RFormula can be used across different datasets.

>>> formula = RFormula(formula="ArrDelay ~ DepDelay + Distance + aircraft_type")
>>> formula.fit(training).transform(training).show()
+--------------+---------+---------+---------+--------------------+------+
| aircraft_type| Distance| DepDelay| ArrDelay| features| label|
+--------------+---------+---------+---------+--------------------+------+
| Balloon| 23| 18| 20| [0.0,0.0,23.0,18.0]| 20.0|
| Multi-Engine| 815| 2| -2| [0.0,1.0,815.0,2.0]| -2.0|
| Single-Engine| 174| 0| 1| [1.0,0.0,174.0,0.0]| 1.0|
+--------------+---------+---------+---------+--------------------+------+

关于r - MLlib : How does RFormula. fit() 工作吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45433652/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com