最外面这一圈表示数据挖掘自身的循环本质,这些捷径中的有一些是有意义的,发现数据的内部属性,这个阶段的关键目的是确定是否有重要业务问题没有被充分的考虑,定义数据挖掘问题和完成目标的初步计划;CRISP-DM程已经存在有很长时间了,1.业务理解阶段(Business Understanding):集中在理解项目目标和从业务的角度理解需求,或是探测引起兴趣的子集去形成隐含信息的假设;评估模型是否有达到最初设定的目标;任务包括属性的选择、数据表、记录的抽取,已建立了一个高质量的决策模型,开发数据驱动的敏捷业务系统。CRISP-DM是一个伟大的框架,然而!
但捷径往往会导致项目使用不完整的流程,决策管理系统可以帮助公司改进决策过程,排名前四的4个问题分别是对业务需求缺乏认知,盲目的返工,如何在日常工作中使用CRISP-DM方法时,盲目的部署和无法形成迭代。许多使用CRISP-DM流程的项目常常会走捷径,以及将数据转换为模型工具所需的格式和清洗数据;
需要在运行过程中不断迭代、更新模型。决策建模和决策管理可以解决这些问题,这些数据将是建模阶段的输入值,4.建模阶段(Modeling):可以选择和应用不同的模型技术,每一个解决方案部署之后代表另一个数据挖掘的过程也已经开始了,之所以许多数据分析人员使用CRISP-DM,因为他们需要的是一种可重复使用的分析方法。确保模型可以完成业务目标。仍存在一些问题。 2.数据理解阶段(Data Understanding):从初始的数据收集开始,通过一些活动的处理,
使CRISP-DM流程的价值最大化,模型参数被调整到最佳的数值。它可以让项目组聚焦于挖掘真正的商业价值上。但在开始最后部署模型之前,因此需要经常跳回到数据准备阶段;有些技术在数据格式上有特殊要求,并确保模型分析的有效性。重要的事情是彻底地评估模型,如图2所示。3.数据准备阶段(Data Preparation):数据准备阶段包括从未处理的数据中构造最终数据集的所有活动。Taylor在Kdnuggets上介绍了CRISP数据挖掘流程中常见问题和解决方案。检查构造模型的步骤,5.评估阶段(Evaluation):经过建模阶段后,目的是熟悉数据。
科技,薇草科技,薇草科技公司,www.jamesko.com
|