gpt4 book ai didi

r - 分类/决策树和选择分割

转载 作者:行者123 更新时间:2023-11-30 09:38:45 29 4
gpt4 key购买 nike

这是一个非常基本的示例。但我正在做一些数据分析,并且不断发现自己编写非常类似的 SQL 计数查询来生成概率表。

我的表被定义为值 0 表示事件未发生,而值 1 表示事件确实发生。

  > sqldf("select count(distinct Date) from joinedData where C_O_Above_prevHigh = 0 and  C_O_Below_prevLow = 0")
count(distinct Date)
1 1081

> sqldf("select count(distinct Date) from joinedData where C_O_Above_prevHigh = 0 and C_O_Below_prevLow = 0 and E_halfGap = 1")
count(distinct Date)
1 956

> sqldf("select count(distinct Date) from joinedData where C_O_Above_prevHigh = 1 OR C_O_Below_prevLow = 1 and E_halfGap = 1")
count(distinct Date)
1 504

在上面的示例中,我的预测变量是 C_O_Above_prevHighC_O_Below_prevLow,我的结果变量是 E_halfGap。在某些情况下,可能会有更多的预测变量,例如时间

R 或其他应用程序中是否有任何可用的内容可以:

1) 根据我的预测变量输出潜在的概率路径?2)允许我选择如何分割路径

感谢您的意见。

最佳答案

如果您想要所有总计和小计,您可以使用CUBE BY在 SQL 中(但不在 SQLite 中)或addmargins在 R 中。

addmargins( Titanic )
# More readable:
ftable( addmargins( Titanic ) )

如果你想构建决策树,您可以使用rpart包裹或检查 machine learning或者 graphical models任务 View

关于r - 分类/决策树和选择分割,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10329502/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com