Pig SUM 函数
-
SUM 函数
Pig-Latin SUM()您可以使用Pig Latin的SUM() 函数来获取单列袋中一列的数值的总和。在计算总数时,SUM() 函数将忽略NULL值。注意-- 若要获取全局总和值,我们需要执行“Group all”操作,并使用SUM() 函数计算总和值。
- 要获得组的总和,我们需要使用Group By运算符将其分组,然后继续求和功能。
句法下面给出的是SUM() 函数的语法。例子假设我们在HDFS目录/ pig_data /中有一个名为employee.txt的文件,如下所示。employee.txt并且我们已将这个文件以关系名称employee_data加载到Pig中,如下所示。 -
计算所有GPA的总和
为了演示SUM()函数,让我们尝试计算所有员工每天键入的页面总数。我们可以使用Apache Pig的内置函数SUM()(区分大小写)来计算数值的总和。让我们使用“所有分组”运算符将雇员名_data关系分组,并将结果存储在名为employee_group的关系中,如下所示。它将产生如下所示的关系。现在,让我们计算每天输入的页面的总和。验证如下所示,使用DUMP运算符验证关系Student_workpages_sum。输出它将产生以下输出,显示如下student_workpages_sum关系的内容。