数据仓库 - 备份

  • 简述

    数据仓库是一个复杂的系统,它包含大量的数据。因此,备份所有数据非常重要,以便将来可以根据需要进行恢复。在本章中,我们将讨论设计备份策略的问题。
  • 备份术语

    在继续之前,您应该了解下面讨论的一些备份术语。
    • 全量备份− 同时备份整个数据库。此备份包括所有数据库文件、控制文件和日志文件。
    • 局部备份− 顾名思义,它不会创建数据库的完整备份。部分备份在大型数据库中非常有用,因为它们允许一种策略,即每天以循环方式备份数据库的各个部分,以便每周有效地备份整个数据库一次。
    • 冷备份− 数据库完全关闭时进行冷备份。在多实例环境中,应关闭所有实例。
    • 热备份− 数据库引擎启动并运行时进行热备份。RDBMS 对热备份的要求各不相同。
    • 在线备份− 类似于热备份。
  • 硬件备份

    决定用于备份的硬件很重要。处理备份和恢复的速度取决于所使用的硬件、硬件的连接方式、网络带宽、备份软件和服务器 I/O 系统的速度。在这里,我们将讨论一些可用的硬件选择及其优缺点。这些选择如下 -
    • 胶带技术
    • 磁盘备份

    胶带技术

    磁带选择可分为以下几类 -
    • 磁带媒体
    • 独立磁带机
    • 胶带堆垛机
    • 磁带筒仓
    磁带平台
    存在多种磁带介质。下表列出了一些磁带介质标准 -
    磁带媒体 容量 输入/输出速率
    分布式账本技术 40GB 3MB/秒
    3490e 1.6GB 3MB/秒
    8 毫米 14GB 1 兆字节/秒
    其他需要考虑的因素如下:
    • 磁带介质的可靠性
    • 每单位磁带介质的成本
    • 可扩展性
    • 升级磁带系统的成本
    • 每单位磁带介质的成本
    • 磁带介质的保质期
    Standalone Tape Drives
    磁带机可以通过以下方式连接 -
    • 直接到服务器
    • 作为网络可用设备
    • 远程到其他机器
    将磁带驱动器连接到数据仓库时可能会出现问题。
    • 假设服务器是一个 48 节点的 MPP 机器。我们不知道连接磁带机的节点,也不知道如何将它们分布在服务器节点上以获得最佳性能,同时最大限度地减少服务器中断和最小内部 I/O 延迟。
    • 将磁带驱动器连接为网络可用设备需要网络能够胜任巨大的数据传输速率。确保在您需要时有足够的带宽可用。
    • 远程连接磁带机也需要高带宽。

    磁带堆垛机

    将多个磁带装入单个磁带驱动器的方法称为磁带堆垛机。堆栈器在用完当前磁带后卸下当前磁带并加载下一个磁带,因此一次只能访问一个磁带。价格和功能可能会有所不同,但共同的能力是它们可以执行无人值守的备份。

    磁带筒仓

    磁带筒仓提供大存储容量。磁带孤岛可以存储和管理数以千计的磁带。它们可以集成多个磁带机。他们有软件和硬件来标记和存储他们存储的磁带。通过网络或专用链路远程连接筒仓是很常见的。我们应该确保连接的带宽适合工作。

    磁盘备份

    磁盘备份的方法是 -
    • 磁盘到磁盘备份
    • 破镜
    这些方法都用在OLTP系统中。这些方法最大限度地减少了数据库停机时间并最大限度地提高了可用性。
    Disk-to-Disk Backups
    这里的备份是在磁盘上而不是在磁带上进行的。由于以下原因完成磁盘到磁盘备份 -
    • 初始备份速度
    • 恢复速度
    将数据从磁盘备份到磁盘比备份到磁带要快得多。但是这是备份的中间步骤。稍后将数据备份到磁带上。磁盘到磁盘备份的另一个优点是它为您提供最新备份的在线副本。
    Mirror Breaking
    这个想法是在工作日对磁盘进行镜像以实现弹性。当需要备份时,可以断开其中一个镜像集。此技术是磁盘到磁盘备份的一种变体。
    Note− 可能需要关闭数据库以保证备份的一致性。

    光学点唱机

    光学点唱机允许数据存储在近线。这种技术允许以与磁带堆垛机或磁带筒仓相同的方式管理大量光盘。这种技术的缺点是写入速度比磁盘慢。但光学介质具有长寿命和可靠性,使其成为存档介质的理想选择。
  • 软件备份

    有一些软件工具可以帮助备份过程。这些软件工具作为一个包提供。这些工具不仅可以进行备份,还可以有效地管理和控制备份策略。市场上有许多可用的软件包。其中一些列于下表 -
    包名字 厂商
    Networker Legato
    ADSM IBM
    Epoch Epoch Systems
    Omniback II HP
    Alexandria Sequent

    选择软件包的标准

    选择最佳软件包的标准如下 -
    • 添加磁带机后产品的可扩展性如何?
    • 软件包是否有客户端-服务器选项,还是必须在数据库服务器本身上运行?
    • 它能在集群和 MPP 环境中工作吗?
    • 需要什么样的并行度?
    • 该软件包支持哪些平台?
    • 软件包是否支持轻松访问有关磁带内容的信息?
    • 包数据库知道吗?
    • 软件包支持哪些磁带驱动器和磁带介质?