Pig 安装
-
安装
本章说明如何在系统中下载,安装和设置Apache Pig。 -
先决条件
-
下载Apache Pig
首先,从以下网站下载最新版本的Apache Pig- https://pig.apache.org/第1步 - 打开Apache Pig网站的主页。在新闻部分下,单击链接发布页面,如以下快照所示。第2步 - 单击指定的链接后,您将被重定向到Apache Pig Releases页面。在此页面的“Download”部分。第3步 - 然后您将被重定向到具有一组镜像的页面。选择并单击清华大学的镜像(更快一些这个镜像),如下所示。步骤4 - 这些镜像将带您到Pig Releases页面。该页面包含各种版本的Apache Pig。单击其中的最新版本。第5步 -在这些文件夹中,您将获得各种发行版的Apache Pig的源文件和二进制文件。下载Apache Pig 0.17,Pig0.17.0-src.tar.gz和pig-0.17.0.tar.gz的源文件和二进制文件的tar文件。 -
安装Apache Pig
下载Apache Pig软件之后,请按照以下步骤在Linux环境中安装它。第1步 - 在安装了Hadoop,Java和其他软件的安装目录的目录中,创建一个名为Pig的目录。(在我们的教程中,我们在名为Hadoop的用户中创建了Pig目录)。第2步 - 提取下载的tar文件,如下所示。(我们只下载了二进制包)第3步 - 将pig-0.17.0.tar.gz文件的内容移动到之前创建的Pig目录中,如下所示。 -
配置Apache Pig
安装Apache Pig之后,我们必须对其进行配置。要进行配置,我们需要编辑两个文件-bashrc和pig.properties。.bashrc文件在.bashrc文件中,设置以下变量-- PIG_HOME文件夹到Apache Pig的安装文件夹,
- PATH环境变量到bin文件夹,以及
- PIG_CLASSPATH环境变量到Hadoop安装的etc(配置)文件夹(包含core-site.xml,hdfs-site.xml和mapred-site.xml文件的目录)中。
pig.properties文件在Pig的conf文件夹中,我们有一个名为pig.properties的文件。在pig.properties文件中,您可以设置以下各种参数。支持以下属性- -
验证安装
通过键入version命令来验证Apache Pig的安装。如果安装成功,您将获得如下所示的Apache Pig版本。