CART算法
CART算法及R语言实现
CART 的英文是Classification And Regression Tree,直译即为分类回归树算法,简称CART算法,它是决策树的一种实现,通常决策树主要有三种实现,分别是 ID3算法、CART算法和C4.5算法。CART算法是一种二分递归分割技术,把当前样本划分为两个子样本,使得生成的每个非叶子节点都有两个分支,因此CART算法生成的决策树是结构简洁的二叉树。即使一个feature有多个取值,也是把数据分为两部分。如果目标变量是连续的,则CART算法找出一组基于树的回归方程来预测目标变量。
#鸢尾花数据集
library(rpart)
train.idx<-sample ( 1:nrow (iris) , 100)
iris.train <-iris[train.idx, ]
iris.test<- iris[-train.idx,]
modelcart <- rpart (Species ~ ., data = iris.train, method = "class")
rescart <- predict (object = modelcart,newdata = iris.test, type = "class")
table(iris.test$Species, rescart,dnn=c("Actual","predicted"))
