例子
假设在HDFS目录/pig_data/中有一个名为date.txt的文件。该文件包含特定人员的出生日期详细信息,身份证,日期和时间。
001,1989/09/26 09:00:00
002,1980/06/20 10:22:00
003,1990/12/19 03:11:44
并且,我们已将这个文件以名为date_data的关系加载到Pig中,如下所示。
grunt> date_data = LOAD 'hdfs://localhost:9000/pig_data/date.txt' USING PigStorage(',') as (id:int,date:chararray);
以下是GetMilliSecond()函数的示例。GetMilliSecond()函数将从给定的日期时间对象中检索当前秒的毫秒数。因此,首先让我们使用todate()函数生成所有员工的日期时间对象,如下所示。
grunt> todate_data = foreach date_data generate ToDate(date,'yyyy/MM/dd HH:mm:ss')
as (date_time:DateTime );
grunt> Dump todate_data;
(1989-09-26T09:00:00.000+05:30)
(1980-06-20T10:22:00.000+05:30)
(1990-12-19T03:11:44.000+05:30)
现在,让我们使用GetMilliSecond()函数从每个雇员的出生时间开始获取秒数,并将其存储在名为getmillisecond_data的关系中,如下所示。
grunt> getmillisecond_data = foreach todate_data generate (date_time), GetMilliSecond(date_time);
现在,使用Dump运算符验证getmillisecond_data关系的内容,如下所示。
grunt> Dump getmillisecond_data;
(1989-09-26T09:00:00.000+05:30,0)
(1980-06-20T10:22:00.000+05:30,0)
(1990-12-19T03:11:44.000+05:30,0)