AWS - Redshift
-
简述
Amazon Redshift是云中完全托管的数据仓库服务。它的数据集范围从 100 GB 到 1 PB。创建数据仓库的初始过程是启动一组计算资源,称为nodes,它们被组织成组,称为cluster. 之后,您可以处理您的查询。 -
如何设置 Amazon Redshift?
以下是设置 Amazon Redshift 的步骤。Step 1− 使用以下步骤登录并启动 Redshift 集群。-
登录 AWS 管理控制台并使用以下链接打开 Amazon Redshift 控制台 - https://console.aws.amazon.com/redshift/
-
使用屏幕右上角的 Region 菜单选择要创建集群的区域。
-
单击启动集群按钮。
-
集群详细信息页面打开。提供所需的详细信息,然后单击继续按钮直到查看页面。
-
确认页面打开。单击关闭按钮完成,以便集群在集群列表中可见。
-
在列表中选择集群并查看集群状态信息。该页面将显示集群状态。
Step 2− 配置安全组以授权客户端连接到集群。对 Redshift 的授权访问取决于客户端是否授权 EC2 实例。按照以下步骤在 EC2-VPC 平台上进行安全组。-
打开 Amazon Redshift 控制台,然后单击导航窗格上的集群。
-
选择所需的集群。其配置选项卡打开。
-
单击安全组。
-
安全组页面打开后,单击入站选项卡。
-
单击编辑按钮。如下所示设置字段,然后单击“保存”按钮。
-
Type− 自定义 TCP 规则。
-
Protocol- TCP。
-
Port Range− 键入启动集群时使用的相同端口号。Amazon Redshift 的默认端口是 5439。
-
Source− 选择自定义 IP,然后键入 0.0.0.0/0。
-
Step 3− 连接到 Redshift 集群。有两种方法可以连接到 Redshift Cluster - 直接或通过 SSL。以下是直接连接的步骤。-
使用 SQL 客户端工具连接集群。它支持与 PostgreSQL JDBC 或 ODBC 驱动程序兼容的 SQL 客户端工具。ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip或 http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip 对于 64 位机器
-
使用以下步骤获取连接字符串。
-
打开 Amazon Redshift 控制台并在导航窗格中选择集群。
-
选择选择的集群并单击配置选项卡。
-
将打开一个页面,如以下屏幕截图所示,其中包含 Cluster Database Properties 下的 JDBC URL。复制网址。
-
-
使用以下步骤将集群与 SQL Workbench/J 连接起来。
-
打开 SQL 工作台/J。
-
选择文件并单击连接窗口。
-
选择创建新的连接配置文件并填写所需的详细信息,例如名称等。
-
单击管理驱动程序并打开管理驱动程序对话框。
-
单击创建新条目按钮并填写所需的详细信息。
-
-
单击文件夹图标并导航到驱动程序位置。最后,单击打开按钮。
-
将 Classname 框和 Sample URL 框留空。单击确定。
-
从列表中选择驱动程序。
-
在 URL 字段中,粘贴复制的 JDBC URL。
-
在各自的字段中输入用户名和密码。
-
选择自动提交框并单击保存配置文件列表。
-
-
Amazon Redshift 的功能
以下是 Amazon Redshift 的功能 --
支持 VPC− 用户可以在 VPC 内启动 Redshift,并通过虚拟网络环境控制对集群的访问。
-
加密− 在 Redshift 中创建表时,可以对存储在 Redshift 中的数据进行加密和配置。
-
SSL− SSL 加密用于加密客户端和 Redshift 之间的连接。
-
可伸缩− 只需单击几下,即可根据需要轻松扩展 Redshift 数据仓库中的节点数量。它还允许在不损失任何性能的情况下扩展存储容量。
-
性价比− Amazon Redshift 是传统数据仓库实践的一种经济高效的替代方案。没有前期成本,没有长期承诺和按需定价结构。
-