《可拓集与可拓数据挖掘》是蔡文于2008年6月由科学出版社出版的专业图书,主要面向高等院校师生、工程技术人员和管理决策人员阅读,也可作为相关专业本科、硕士、博士生的选修课教材。
可拓
数据挖掘以可拓集为集合论基础,结合可拓方法与现有数据挖掘方法去挖掘数据库或数据仓库中基于可拓变换的知识,为经济、金融、管理、营销、策划、医学、设计等领域的决策和技术创新提供依据。本书是第一本可拓数据挖掘的专著,提出了研究这一领域的理论基础、方法体系和应用范围,并给出简单、浅显的实用案例。本书理论与应用相结合,分析透彻。为方便不同知识背景和不同层次读者的学习,书中配备了通俗易懂的案例。
在实际工作中,要处理各种各样的矛盾问题,通过可拓变换,可以使“不是”变为“是”,“不行”变为“行”,例如,通过吃药,会使病人从有病变为无病,处方不同,病人病情的变化会不同,所属疾病的类型和程度的变化也不同;在化学实验中,改变不同的配方,会得到不同的结果;在经济活动中,对银行的利率采用不同的加息措施,经济从过热转化为不过热的程度和效果会不同;在市场营销中,决策者采用不同的措施,对产品从滞销变为畅销的作用也不同……在这些活动中,变换的知识起着重要的作用.由于
计算机技术的发展,在上述活动过程中,积累了大量的数据。如何从这些变化的数据中,挖掘出有用的知识,进而为解决矛盾问题服务,这为
数据挖掘的研究提出了重要的课题.
知识发现(knowledge discovery in database,KDD)是从数据中发现有用知识的整个过程.数据挖掘是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式(Pattern)
KDD是从数据集中识别出有效的、新颖的、潜在有用的以及最终可理解的模式的高级处理过程,其中,数据集是事实F(数据库元组)的集合;模式是用语言L表示的表达式E,它所描述的数据是集合F的一个
子集FE,它比枚举所有FE中元素更简单,称E为模式,发现的模式有一定的可信度,应该是新的,将来有实用价值,能被用户所理解.