Pig DISTINCT 运算符
-
DISTINCT 运算符
Pig Latin的DISTINCT运算符用于从关系去除冗余(重复)的元组。句法下面给出的是DISTINCT运算符的语法。例假设我们在HDFS目录/pig_data/中有一个名为student_details.txt的文件,如下所示。并且我们已经将该文件加载到Pig中,关系名称为student_details,如下所示。现在,让我们使用DISTINCT运算符从名为Student_details的关系中删除冗余(重复的)元组,并将其存储为另一个名为distinct_data的关系,如下所示。验证如下所示,使用DUMP运算符验证关系distinct_data。输出它会产生以下输出,显示所述关系的内容distinct_data如下。