我在R中使用rpart进行分类。树模型通过以下方式进行训练:
> tree <- rpart(activity ~ . , data=trainData)
> pData1 <- predict(tree, testData, type="class")
此树模型的准确性为:
> sum(testData$activity==pData1)/length(pData1)
[1] 0.8094276
我读了一个 教程 通过交叉验证来修剪树:
> ptree <- prune(tree,cp=tree$cptable[which.min(tree$cptable[,"xerror"]),"CP"])
> pData2 <- predict(ptree, testData, type="class")
修剪树的准确率仍然相同:
> sum(testData$activity==pData2)/length(pData2)
[1] 0.8094276
我想知道修剪过的树有什么问题?如何在R中使用交叉验证修剪树模型?谢谢。