我有一个数据集,其中包含年龄,城市,儿童年龄等信息以及结果(确认,接受)。
为了帮助“工作流程”的模型化,我想基于以前的数据集自动创建决策树。
我看一看 http://en.wikipedia.org/wiki/Decision_tree_learning 我知道这个问题显然不明显。
我只是想对一些算法或一些关于这个主题的库提出建议,这可以帮助我构建基于样本的决策树。
我有一个数据集,其中包含年龄,城市,儿童年龄等信息以及结果(确认,接受)。
为了帮助“工作流程”的模型化,我想基于以前的数据集自动创建决策树。
我看一看 http://en.wikipedia.org/wiki/Decision_tree_learning 我知道这个问题显然不明显。
我只是想对一些算法或一些关于这个主题的库提出建议,这可以帮助我构建基于样本的决策树。
你应该看看 WEKA,一个免费的基于Java的监督学习套件。
将您的数据转换为Weka的简单文本后 .arff格式,您应该能够使用GUI或命令行界面来训练和测试该数据上的各种不同分类器,包括:
尝试使用此界面可以让您轻松尝试不同的分类器和训练参数,以确定哪些分类器和训练参数对您的数据执行最佳。
你也可以 使用API将Weka集成到您自己的源代码中。
如果您想比较Weka的不同类型决策树的效果,请参阅TunedIT.org中收集的基准测试结果:
http://tunedit.org/results?d=UCI&a=Weka*tree。
使用下拉列表和算法/数据集的名称模式来选择应该显示哪些结果。