例子
假设在HDFS目录/pig_data/中有一个名为date.txt的文件。该文件包含特定人员的出生日期详细信息,身份证,日期和时间。
001,1989/09/26 09:00:00
002,1980/06/20 10:22:00
003,1990/12/19 03:11:44
并且,我们已将这个文件以名为date_data的关系加载到Pig中,如下所示。
grunt> date_data = LOAD 'hdfs://localhost:9000/pig_data/date.txt' USING PigStorage(',') as (id:int,date:chararray);
以下是GetDay()函数的示例。GetDay()函数将从给定的Date-Time对象中检索日期。因此,首先,让我们使用todate()函数生成所有员工的日期时间对象,如下所示。
grunt> todate_data = foreach date_data generate ToDate(date,'yyyy/MM/dd HH:mm:ss')
as (date_time:DateTime );
grunt> Dump todate_data;
(1989-09-26T09:00:00.000+05:30)
(1980-06-20T10:22:00.000+05:30)
(1990-12-19T03:11:44.000+05:30)
现在,让我们使用GetDay()函数从出生日期获取日期并将其存储在名为getday_data的关系中。
grunt> getday_data = foreach todate_data generate(date_time), GetDay(date_time);
使用Dump运算符验证getday_data关系的内容。
grunt> Dump getday_data;
(1989-09-26T09:00:00.000+05:30,26)
(1980-06-20T10:22:00.000+05:30,20)
(1990-12-19T03:11:44.000+05:30,19)