数据挖掘 - 教程

  • 简述

    数据挖掘被定义为从大量数据中提取信息的过程。换句话说,我们可以说数据挖掘就是从数据中挖掘知识。本教程从基本概述和数据挖掘中涉及的术语开始,然后逐渐涵盖知识发现、查询语言、分类和预测、决策树归纳、聚类分析以及如何挖掘 Web 等主题。
    本教程是为计算机科学专业的毕业生准备的,旨在帮助他们理解与数据挖掘相关的从基础到高级的概念。
    在继续本教程之前,您应该了解基本的数据库概念,例如模式、ER 模型、结构化查询语言和数据仓库概念的基本知识。
    信息产业中有大量可用的数据。这些数据在转化为有用信息之前是没有用的。有必要分析这些海量数据并从中提取有用的信息。
    信息提取不是我们需要执行的唯一过程;数据挖掘还涉及其他过程,例如数据清理、数据集成、数据转换、数据挖掘、模式评估和数据表示。一旦所有这些过程结束,我们就可以在许多应用程序中使用这些信息,例如欺诈检测、市场分析、生产控制、科学探索等。
  • 什么是数据挖掘?

    数据挖掘被定义为从大量数据中提取信息。换句话说,我们可以说数据挖掘是从数据中挖掘知识的过程。提取的信息或知识可用于以下任何应用程序 -
    • 市场分析
    • 欺诈识别
    • 客户保留
    • 产品控制
    • 科学探索
  • 数据挖掘应用

    数据挖掘在以下领域非常有用 -
    • 市场分析与管理
    • 企业分析与风险管理
    • 欺诈识别
    除此之外,数据挖掘还可用于生产控制、客户保留、科学探索、体育、占星术和 Internet Web Surf-Aid 等领域
  • 市场分析与管理

    下面列出了使用数据挖掘的各个市场领域 -
    • 客户分析− 数据挖掘有助于确定什么样的人购买什么样的产品。
    • 识别客户需求− 数据挖掘有助于为不同客户确定最佳产品。它使用预测来寻找可能吸引新客户的因素。
    • 跨市场分析− 数据挖掘执行产品销售之间的关联/相关。
    • 目标市场营销− 数据挖掘有助于找到具有相同特征(如兴趣、消费习惯、收入等)的模型客户群。
    • 确定客户购买模式− 数据挖掘有助于确定客户购买模式。
    • 提供摘要信息− 数据挖掘为我们提供了各种多维度的汇总报告。
  • 企业分析与风险管理

    数据挖掘用于企业部门的以下领域 -
    • 财务规划和资产评估− 它涉及现金流分析和预测、或有债权分析以评估资产。
    • 资源规划− 它涉及总结和比较资源和支出。
    • 竞争− 它涉及监控竞争对手和市场方向。
  • 欺诈识别

    数据挖掘也用于信用卡服务和电信领域以检测欺诈行为。在欺诈电话中,它有助于找到呼叫的目的地、呼叫的持续时间、一天或一周的时间等。它还分析了偏离预期规范的模式。