文档介绍
PAGEPAGE1填空题Web挖掘可分为 、 和 3大类。数据仓库需要统一数据源,包括统一 、统一 、统一 和统一数据特征4个方面。数据分割通常按时间、 、 、 以及组合方法进行。噪声数据处理的方法主要有 、 和 。数值归约的常用方法有 、 、 、 和对数模型等。评价关联规则的2个主要指标是 和 。多维数据集通常采用 或雪花型架构,以 表为中心,连接多个 表。决策树是用 作为结点,用 作为分支的树结构。关联可分为简单关联、 和 。BP神经网络的作用函数通常为 区间的 。数据挖掘的过程主要包括确定业务对象、 、 、 及知识同化等几个步骤。数据挖掘技术主要涉及 、 和 3个技术领域。数据挖掘的主要功能包括 、 、 、 、趋势分析、孤立点分析和偏差分析7个方面。人工神经网络具有 和 等特点,其结构模型包括 、 和自组织网络3种。数据仓库数据的4个基本特征是 、 、非易失、随时间变化。数据仓库的数据通常划分为 、 、 和 等几个级别。数据预处理的主要内容(方法)包括 、 、 和数据归约等。平滑分箱数据的方法主要有 、 和 。数据挖掘发现知识的类型主要有广义知识、 、 、 和偏差型知识五种。OLAP的数据组织方式主要有 和 两种。常见的OLAP多维数据分析包括 、 、 和旋转等操作。传统的决策支持系统是以 和 驱动,而新决策支持系统则是以 、建立在 和 技术之上。OLAP的数据组织方式主要有 和 2种。SQLServer2000的OLAP组件叫 ,OLAP操作窗口叫 。BP神经网络由 、 以及一或多个 结点组成。遗传算法包括 、 、 3个基本算子。聚类分析的数据通常可分为区间标度变量、 、 、 、序数型以及混合类型等。聚类分析中