除了内置函数之外,Apache Pig还为 User Defined Function(UDF:用户定义函数)提供广泛的支持。使用这些UDF,可以定义我们自己的函数并使用它们。UDF支持六种编程语言,即Java,Jython,Python,JavaScript,Ruby和Groovy。
在本章中,我们将了解如何以批处理模式运行Apache Pig脚本。Pig脚本中的注释在将脚本写入文件时,我们可以在其中包含注释,如下所示。多行注释我们将用'/*'开始多行注释,以'*/'结束。/*
在Apache Pig中有以下String函数。S.N.函数 & 描述1ENDSWITH(string, testAgainst)验证给定字符串是否以特定子字符串结尾。2STARTSWITH(string, substring)接受两个字符串参数,并验证第一个字符串是否以第二个字符串开头。
调用Grunt shell后,可以在shell中运行Pig脚本。除此之外,还有由Grunt shell提供的一些有用的shell和实用程序命令。本章讲解的是Grunt shell提供的shell和实用程序命令。注意:在本章的某些部分中,使用了Load和Store等命令。
Apache Pig提供了各种内置函数,即 eval,load,store,math,string,bag 和 tuple 函数。Eval函数下面给出了Apache Pig提供的 eval 函数列表。S.N.函数 & 描述1AVG()计算包内数值的平均值。
我们在Apache Pig中有以下Math(数学)函数:S.N.函数 & 描述1ABS(expression)获取表达式的绝对值。2ACOS(expression)获得表达式的反余弦值。3ASIN(expression)获取表达式的反正弦值。
ORDER BY 运算符用于以基于一个或多个字段的排序顺序显示关系的内容。语法下面给出了 ORDER BY 运算符的语法。grunt> Relation_name2 = ORDER Relatin_name1 BY (ASC|DESC);
LIMIT 运算符用于从关系中获取有限数量的元组。语法下面给出了 LIMIT 运算符的语法。grunt> Result = LIMIT Relation_name required number of tuples;
长按识别二维码并关注微信
更方便到期提醒、手机管理