数据挖掘——进阶篇-亚博电子竞技官网

2021-03-27

本文摘要:从数据本身考虑,数据挖掘一般需要八个步骤:信息采集、数据构建、数据规约、数据清理、数据转换、数据挖掘执行过程、模式评估和科学知识响应。

亚博电子竞技官网

从数据本身考虑,数据挖掘一般需要八个步骤:信息采集、数据构建、数据规约、数据清理、数据转换、数据挖掘执行过程、模式评估和科学知识响应。步骤(1)信息收集:根据确认的数据分析对象,抽象化数据分析所需的特征信息,自由选择合适的信息收集方法,收集的信息现金数据库。对于海量数据,自由选择合适的数据存储和管理数据仓库很重要。

亚博电子竞技官网

步骤(2)数据构建:逻辑上有机地集中不同来源、形式、特征性质的数据,为企业获得全面的数据共享。步骤(3)数据规定:如果继续执行大部分数据挖掘算法,即使是少量数据也需要很长时间,商业运营数据挖掘时的数据量往往非常大。数据约束技术可以用来获得数据集的约束回应,虽然大得多,但仍然类似于维持原始数据的完整性,约束后继续实施数据挖掘的结果与约束前的继续实施结果完全相同或完全相同。

亚博登录

步骤(4)数据清洁:数据库中的数据不据不是原始的(一些感兴趣的属性缺乏属性值),不含噪音(包括错误的属性值),不完全一致(一定程度的信息有不同的应对方法),因此必须进行数据清洁否则,挖掘的结果并不强烈。步骤(5)数据转换:通过光滑的挤压、数据概况化、规范化等方式将数据转换为限于数据挖掘的形式。

亚博登录

对于一些实数型数据,通过概念层次和数据线性化切换数据也是最重要的一步。步骤(6)数据挖掘过程:根据数据仓库的数据信息,自由选择合适的分析工具,应用于统计数据方法、事例推理小说、决策树、规则推理小说、模糊集,以及神经网络、遗传算法的方法处理信息,得出结论简单的分析信息。步骤(7)模型评价:从商业角度来看,业界专家检查数据挖掘结果的正确性。

步骤(8)科学知识应对:将数据挖掘得到的分析信息可视化地表现给用户,或者作为新的科学知识保管在知识库中,可以用于其他应用程序。数据挖掘过程是一个重复循环的过程,如果每个步骤都没有超出预期的目标,就必须返回以前的步骤,进行新的调整和执行。并非所有的数据挖掘工作都必须列在这里的所有步骤。例如,如果某项工作中没有多个数据源,则步骤(2)后可以省略。

步骤(3)数据规约、步骤(4)数据清扫、步骤(5)数据转换和同名数据预处理。在数据挖掘中,至少60%的费用可能需要步骤(1)信息收集阶段,其中至少60%以上的能源和时间需要数据预处理。


本文关键词:亚博电子竞技官网,亚博登录

本文来源:亚博电子竞技官网-www.jebamindtricks.com


全国热线:0208-343420804

联系地址:广东省广州市天河区88号

Copyright © 2000-2020 www.jebamindtricks.com. 亚博电子竞技官网科技 版权所有 | ICP备56335908号-9