决策树分类模型算法实验报告.doc

想预览更多内容,点击预览全文

申明敬告:

本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。如果您已付费下载过本站文档,您可以点击这里二次下载

文档介绍

鲁东大学信息与电气工程学院

商 务 智 能 实 验 报 告

(2019—2020学年第一学期)

课程名称 商务智能

实验题目 决策树分类数据挖掘

专 业 信息管理与信息系统

班 级 信管1702

姓 名 _ 邱勇溪

学 号 20172203261

2019年 11 月 22 日

实验目的及要求

1.1目的:

(1) 初步了解决策树算法的基本思想

(2) 理解决策树模型的具体实现步骤

(3)学会运用数据挖掘工具实现数据挖掘过程

1.2要求:

(1)整理决策树算法理论

(2)建立数据挖掘项目

(3)设置数据源视图

(4)建立数据挖掘结构

(5)查看决策树对三国人物身份的分类挖掘结果

2.决策树算法概念及优缺点 概念:决策树模型是一种简单易用的非参数分类器。它不需要对 \t "/item/%E5%86%B3%E7%AD%96%E6%A0%91%E6%A8%A1%E5%9E%8B/_blank" 数据有任何的先验假设,计算速度较快,结果容易解释,而且稳健性强。

决策树模型优点:

(1)浅层的(Shallow)决策树视觉上非常直观,而且容易解释。

(2)对数据的结构和分布不需作任何假设。

(3)可以捕捉住变量间的相互作用(Interaction)。

决策树模型缺点:

(1)深层的(Deep)决策树视觉上和解释上都比较困难。

(2)决策树容易过分微调于样本数据而失去稳定性和抗震荡性。

(3)决策树对样本量(Sample Size)的需求比较大。

(4)处理缺失值的功能非常有限。

框架分析及模块分解

2.1框架和分类方法

(1)制定预测精度性的标准规范

(2)选择分裂(分层)技术

(3)定义停止分裂(分层)的时间点

(4)选择适当大小的决策树

决策树分类方法:

从数据中生成分类器的一个有效的方法就是生成一个决策树。是从一组无次序、无规则的事例中推理出决策树表示形式的分

您可能关注的文档

最近下载