数据挖掘 - 教程
-
简述
数据挖掘被定义为从大量数据中提取信息的过程。换句话说,我们可以说数据挖掘就是从数据中挖掘知识。本教程从基本概述和数据挖掘中涉及的术语开始,然后逐渐涵盖知识发现、查询语言、分类和预测、决策树归纳、聚类分析以及如何挖掘 Web 等主题。本教程是为计算机科学专业的毕业生准备的,旨在帮助他们理解与数据挖掘相关的从基础到高级的概念。在继续本教程之前,您应该了解基本的数据库概念,例如模式、ER 模型、结构化查询语言和数据仓库概念的基本知识。信息产业中有大量可用的数据。这些数据在转化为有用信息之前是没有用的。有必要分析这些海量数据并从中提取有用的信息。信息提取不是我们需要执行的唯一过程;数据挖掘还涉及其他过程,例如数据清理、数据集成、数据转换、数据挖掘、模式评估和数据表示。一旦所有这些过程结束,我们就可以在许多应用程序中使用这些信息,例如欺诈检测、市场分析、生产控制、科学探索等。 -
什么是数据挖掘?
数据挖掘被定义为从大量数据中提取信息。换句话说,我们可以说数据挖掘是从数据中挖掘知识的过程。提取的信息或知识可用于以下任何应用程序 -- 市场分析
- 欺诈识别
- 客户保留
- 产品控制
- 科学探索
-
数据挖掘应用
数据挖掘在以下领域非常有用 -- 市场分析与管理
- 企业分析与风险管理
- 欺诈识别
除此之外,数据挖掘还可用于生产控制、客户保留、科学探索、体育、占星术和 Internet Web Surf-Aid 等领域 -
市场分析与管理
下面列出了使用数据挖掘的各个市场领域 --
客户分析− 数据挖掘有助于确定什么样的人购买什么样的产品。
-
识别客户需求− 数据挖掘有助于为不同客户确定最佳产品。它使用预测来寻找可能吸引新客户的因素。
-
跨市场分析− 数据挖掘执行产品销售之间的关联/相关。
-
目标市场营销− 数据挖掘有助于找到具有相同特征(如兴趣、消费习惯、收入等)的模型客户群。
-
确定客户购买模式− 数据挖掘有助于确定客户购买模式。
-
提供摘要信息− 数据挖掘为我们提供了各种多维度的汇总报告。
-
-
企业分析与风险管理
数据挖掘用于企业部门的以下领域 --
财务规划和资产评估− 它涉及现金流分析和预测、或有债权分析以评估资产。
-
资源规划− 它涉及总结和比较资源和支出。
-
竞争− 它涉及监控竞争对手和市场方向。
-
-
欺诈识别
数据挖掘也用于信用卡服务和电信领域以检测欺诈行为。在欺诈电话中,它有助于找到呼叫的目的地、呼叫的持续时间、一天或一周的时间等。它还分析了偏离预期规范的模式。