成都公司:成都市成华区建设南路160号1层9号
重庆公司:重庆市江北区红旗河沟华创商务大厦18楼
知识发现过程的几个步骤
知识发现是从数据中发现有用知识的整个过程;数据开采是知识发现过程中的一个特定步骤,它用专门算法从数据中抽取模式(patterns)。1996年,Fayyad、PiatetskyShapiror和Smyth将知识发现过程定义为:从数据中鉴别出有效模式的非平凡过程,该模式是新的、可能有用的和最终可理解的。
知识发现过程是多个步骤相互连接、反复进行人机交互的过程。具体包括以下步骤:
1.学习某个应用领域:包括应用中的预先知识和目标。
2.建立目标数据集:选择一个数据集或在多数据集的子集上聚焦。
3.数据预处理:去除噪声或无关数据,去除空白数据域,考虑时间顺序和数据变化等。
4.数据转换:找到数据的特征表示,用维变换或转换方法减少有效变量的数目或找到数据的不变式。
5.选定数据挖掘功能:决定数据挖掘的目的。
6.选定数据挖掘算法:用知识发现过程中的准则,选择某个特定数据挖掘算法(如汇总、分类、回归、聚类等)用于搜索数据中的模式。
7.数据挖掘:搜索或产生一个特定的感兴趣的模式或一个特定的数据集。
8.解释:解释某个发现的模式,去掉多余的不切题意的模式,转换某个有用的模式,以使用户明白。
9.发现知识:把这些知识结合到知识管理系统中,获得这些知识的作用或证明这些知识。用预先、可信的知识检查和解决知识中可能的矛盾。
本站推荐

