hive自定义函数

2024-05-13 14:38:03
开发
7

hive自定义函数

当Hive的内置函数不能满足需要时，可以通过编写用户自定义函数UDF（User-Defined Functions）插入自己的处理代码并在查询中使用它们。

按实现方式，UDF分如下分类：
•普通的UDF，用于操作单个数据行，且产生一个数据行作为输出。
•用户定义聚集函数UDAF（User-Defined Aggregating Functions），用于接受多个输入数据行，并产生一个输出数据行。
•用户定义表生成函数UDTF(User-Defined Table-Generating Functions)，用于操作单个输入行，产生多个输出行。

按使用方法，UDF有如下分类：
•临时函数，只能在当前会话使用，重启会话后需要重新创建。
•永久函数，可以在多个会话中使用，不需要每次创建。

说明:
•一个普通UDF必须继承自“org.apache.hadoop.hive.ql.exec.UDF”。
•一个普通UDF必须至少实现一个evaluate()方法，evaluate函数支持重载。
•开发自定义函数需要在工程中添加hive-exec-3.1.0.jar依赖包，可从hive安装目录下获取。

示例:
java代码如下:

package day05_jar;

import org.apache.hadoop.hive.ql.exec.UDF;

public class TestHiveUdf extends UDF {
    public static String evaluate(String str) {
        return str.toUpperCase();
    }
}

hadoop fs -mkdir /user/hive/warehouse/hdfs-examples
hadoop fs -put -f  pinko.jar /user/hive/warehouse/hdfs-examples

CREATE FUNCTION ypg_upperstring AS 'day05_jar.TestHiveUdf' using jar ' /user/hive/warehouse/hdfs-examples/pinko.jar';

select ypg_upperstring('hello');
 ypg_upperstring
-----------------
 HELLO
(1 row)

原文地址:https://blog.csdn.net/weixin_45547818/article/details/138632187 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1789907942879924224.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部