AWS - Redshift

  • 简述

    Amazon Redshift是云中完全托管的数据仓库服务。它的数据集范围从 100 GB 到 1 PB。创建数据仓库的初始过程是启动一组计算资源,称为nodes,它们被组织成组,称为cluster. 之后,您可以处理您的查询。
  • 如何设置 Amazon Redshift?

    以下是设置 Amazon Redshift 的步骤。
    Step 1− 使用以下步骤登录并启动 Redshift 集群。
    • 登录 AWS 管理控制台并使用以下链接打开 Amazon Redshift 控制台 - https://console.aws.amazon.com/redshift/
    • 使用屏幕右上角的 Region 菜单选择要创建集群的区域。
    • 单击启动集群按钮。
    启动集群
    • 集群详细信息页面打开。提供所需的详细信息,然后单击继续按钮直到查看页面。
    集群详细信息
    • 确认页面打开。单击关闭按钮完成,以便集群在集群列表中可见。
    集群关闭
    • 在列表中选择集群并查看集群状态信息。该页面将显示集群状态。
    集群状态
    Step 2− 配置安全组以授权客户端连接到集群。对 Redshift 的授权访问取决于客户端是否授权 EC2 实例。
    按照以下步骤在 EC2-VPC 平台上进行安全组。
    • 打开 Amazon Redshift 控制台,然后单击导航窗格上的集群。
    • 选择所需的集群。其配置选项卡打开。
    雪犁
    • 单击安全组。
    • 安全组页面打开后,单击入站选项卡。
    安全组
    • 单击编辑按钮。如下所示设置字段,然后单击“保存”按钮。
      • Type− 自定义 TCP 规则。
      • Protocol- TCP。
      • Port Range− 键入启动集群时使用的相同端口号。Amazon Redshift 的默认端口是 5439。
      • Source− 选择自定义 IP,然后键入 0.0.0.0/0。
    编辑入站规则
    Step 3− 连接到 Redshift 集群。
    有两种方法可以连接到 Redshift Cluster - 直接或通过 SSL。
    以下是直接连接的步骤。
    • 使用 SQL 客户端工具连接集群。它支持与 PostgreSQL JDBC 或 ODBC 驱动程序兼容的 SQL 客户端工具。
      ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip或 http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip 对于 64 位机器
    • 使用以下步骤获取连接字符串。
      • 打开 Amazon Redshift 控制台并在导航窗格中选择集群。
      • 选择选择的集群并单击配置选项卡。
      • 将打开一个页面,如以下屏幕截图所示,其中包含 Cluster Database Properties 下的 JDBC URL。复制网址。
    簇
    • 使用以下步骤将集群与 SQL Workbench/J 连接起来。
      • 打开 SQL 工作台/J。
      • 选择文件并单击连接窗口。
      • 选择创建新的连接配置文件并填写所需的详细信息,例如名称等。
      • 单击管理驱动程序并打开管理驱动程序对话框。
      • 单击创建新条目按钮并填写所需的详细信息。
    管理驱动程序
    • 单击文件夹图标并导航到驱动程序位置。最后,单击打开按钮。
    红移
    • 将 Classname 框和 Sample URL 框留空。单击确定。
    • 从列表中选择驱动程序。
    • 在 URL 字段中,粘贴复制的 JDBC URL。
    • 在各自的字段中输入用户名和密码。
    • 选择自动提交框并单击保存配置文件列表。
    选择连接配置文件
  • Amazon Redshift 的功能

    以下是 Amazon Redshift 的功能 -
    • 支持 VPC− 用户可以在 VPC 内启动 Redshift,并通过虚拟网络环境控制对集群的访问。
    • 加密− 在 Redshift 中创建表时,可以对存储在 Redshift 中的数据进行加密和配置。
    • SSL− SSL 加密用于加密客户端和 Redshift 之间的连接。
    • 可伸缩− 只需单击几下,即可根据需要轻松扩展 Redshift 数据仓库中的节点数量。它还允许在不损失任何性能的情况下扩展存储容量。
    • 性价比− Amazon Redshift 是传统数据仓库实践的一种经济高效的替代方案。没有前期成本,没有长期承诺和按需定价结构。