Pig SUBTRACT 函数
-
SUBTRACT 函数
Pig-Latin SUBTRACT()函数用于减去两个bag。它以两个bag作为输入,并返回一个bag,其中包含不在第二个bag中的第一个bag的元组。句法下面给出的是SUBTRACT() 函数的语法。例子假设我们在HDFS目录/pig_data/中有两个文件,分别是emp_sales.txt和emp_bonus.txt,如下所示。该emp_sales.txt包含销售部门的员工的细节和emp_bonus.txt包含员工详细谁得到奖金。emp_sales.txtemp_bonus.txt我们已经将这些文件加载到Pig中,它们的关系名称分别为emp_sales和emp_bonus。现在,让我们使用COGROUP运算符使用键sno将emp_sales和emp_bonus关系的记录/元组分组,如下所示。如下所示,使用DUMP运算符验证关系cogroup_data。 -
减去另一种关系
现在让我们从emp_sales关系中减去emp_bonus关系的元组。结果关系包含emp_bonus中不存在的emp_sales元组。验证如下所示,使用DUMP运算符验证关系sub_data。该emp_sales关系认为,不存在关系中的元组emp_bonus。以同样的方式,让我们减去emp_sales从关系emp_bonus关系如下图所示。如下所示,使用Dump运算符验证sub_data关系的内容。