决策树分类模型算法实验报告.doc
- 机械中的AI混子个人认证 |
- 2019-12-06 发布|
- 487 KB|
- 8页
鲁东大学信息与电气工程学院
商 务 智 能 实 验 报 告
(2019—2020学年第一学期)
课程名称 商务智能
实验题目 决策树分类数据挖掘
专 业 信息管理与信息系统
班 级 信管1702
姓 名 _ 邱勇溪
学 号 20172203261
2019年 11 月 22 日
实验目的及要求
1.1目的:
(1) 初步了解决策树算法的基本思想
(2) 理解决策树模型的具体实现步骤
(3)学会运用数据挖掘工具实现数据挖掘过程
1.2要求:
(1)整理决策树算法理论
(2)建立数据挖掘项目
(3)设置数据源视图
(4)建立数据挖掘结构
(5)查看决策树对三国人物身份的分类挖掘结果
2.决策树算法概念及优缺点 概念:决策树模型是一种简单易用的非参数分类器。它不需要对 \t "/item/%E5%86%B3%E7%AD%96%E6%A0%91%E6%A8%A1%E5%9E%8B/_blank" 数据有任何的先验假设,计算速度较快,结果容易解释,而且稳健性强。
决策树模型优点:
(1)浅层的(Shallow)决策树视觉上非常直观,而且容易解释。
(2)对数据的结构和分布不需作任何假设。
(3)可以捕捉住变量间的相互作用(Interaction)。
决策树模型缺点:
(1)深层的(Deep)决策树视觉上和解释上都比较困难。
(2)决策树容易过分微调于样本数据而失去稳定性和抗震荡性。
(3)决策树对样本量(Sample Size)的需求比较大。
(4)处理缺失值的功能非常有限。
框架分析及模块分解
2.1框架和分类方法
(1)制定预测精度性的标准规范
(2)选择分裂(分层)技术
(3)定义停止分裂(分层)的时间点
(4)选择适当大小的决策树
决策树分类方法:
从数据中生成分类器的一个有效的方法就是生成一个决策树。是从一组无次序、无规则的事例中推理出决策树表示形式的分