例子
假设在HDFS目录/pig_data/中有一个名为date.txt的文件。该文件包含特定人员的出生日期详细信息,身份证,日期和时间。
001,1989/09/26 09:00:00
002,1980/06/20 10:22:00
003,1990/12/19 03:11:44
并且,我们已将这个文件以名为date_data的关系加载到Pig中,如下所示。
grunt> date_data = LOAD 'hdfs://localhost:9000/pig_data/date.txt' USING PigStorage(',') as (id:int,date:chararray);
以下是GetHour()函数的示例。该GetHour()函数将retrive一天的时间从给定的日期时间对象。因此,首先,让我们使用todate()函数生成所有员工的Date-Time对象。
grunt> todate_data = foreach date_data generate ToDate(date,'yyyy/MM/dd HH:mm:ss')
as (date_time:DateTime );
grunt> Dump todate_data;
(1989-09-26T09:00:00.000+05:30)
(1980-06-20T10:22:00.000+05:30)
(1990-12-19T03:11:44.000+05:30)
现在让我们使用GetDay()函数从每个雇员的出生时间开始计算小时,并将其存储在名为gethour_data的关系中。
grunt> gethour_data = foreach todate_data generate (date_time), GetHour(date_time);
现在,使用Dump运算符验证getday_data关系的内容,如下所示。
grunt> Dump gethour_data;
(1989-09-26T09:00:00.000+05:30,9)
(1980-06-20T10:22:00.000+05:30,10)
(1990-12-19T03:11:44.000+05:30,3)