Pig COUNT_STAR 函数
-
COUNT_STAR 函数
Pig-Latin COUNT_STAR() 函数类似于COUNT() 函数。它用于获取bag中元素的数量。在计数元素时,COUNT_STAR() 函数包含NULL值。注意-- 要获取全局计数值(bag中的元组总数),我们需要执行“Group ALL”操作,并使用COUNT_STAR() 函数计算count_star值。
- 要获取组的计数值(组中的元组数),我们需要使用Group By运算符将其分组,然后继续执行count_star函数。
句法下面给出了COUNT_STAR() 函数的语法。例子假设我们在HDFS目录/pig_data/中有一个名为student_details.txt的文件,如下所示。该文件包含一个空记录。并且我们已经将该文件加载到Pig中,关系名称为student_details,如下所示。 -
计算元组数
我们可以使用内置函数COUNT_STAR() 来计算关系中的元组数。让我们使用“group all”运算符将“ student_details ”关系分组,并将结果存储在名为“ student_group_all”的关系中,如下所示。它将产生如下所示的关系。现在让我们计算该关系中的元组/记录数。验证如下所示,使用DUMP运算符验证关系Student_count。输出它将产生以下输出,显示关系student_count的内容。由于我们使用了函数COUNT_STAR() ,因此它包含空元组并返回9。