您好,欢迎访问一九零五行业门户网

hive的udf的编写

1.配置环境 1.引入jar包:hive-exec-0.8.0.jar 和 hadoop-core-0.20.2.jar 2.编写udf函数 1.extends udf 2.重新定义udf的evaluate函数。 package com.qunar.hiveudf;import java.text.simpledateformat;import java.util.calendar;import java.util.date;imp
1.配置环境1.引入jar包:hive-exec-0.8.0.jar 和 hadoop-core-0.20.2.jar2.编写udf函数1.extends udf 2.重新定义udf的evaluate函数。package com.qunar.hiveudf;import java.text.simpledateformat;import java.util.calendar;import java.util.date;import org.apache.hadoop.hive.ql.exec.udf;public class issundayorsaturday extends udf{ public boolean evaluate(string datestring) { try { //将string转化为date string str = datestring.split( )[0]; simpledateformat sdf= new simpledateformat(yyyy-mm-dd); date date =sdf.parse(str); //将date转换为calendar calendar calendar = calendar.getinstance(); calendar.settime(date); //获取date的星期 int week = calendar.get(calendar.day_of_week)-1; if(week == 0 || week == 6) { return true; } else { return false; } } catch (exception e) { // todo: handle exception return false; } }}
3.将jar包引入hadoop环境1.将jar放入hive的lib的物理目录下;
2.打开hive客户端,加入jar包 add jar /home/hive/lib/hiveudf.jar
3.创建一个临时文件 create temporary function issundayorsaturday as 'com.qunar.hiveudf.issundayorsaturday'
4.调用函数 select issundayorsaturday(intime) from user_tag注意:1.如果函数的参数中含有文件,则先要将文件放入hive的运行环境中 add file /home/filename
其它类似信息

推荐信息