久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

    1. <style id="76ofp"></style>

      <style id="76ofp"></style>
      <rt id="76ofp"></rt>
      <form id="76ofp"><optgroup id="76ofp"></optgroup></form>
      1. 千鋒教育-做有情懷、有良心、有品質的職業(yè)教育機構

        手機站
        千鋒教育

        千鋒學習站 | 隨時隨地免費學

        千鋒教育

        掃一掃進入千鋒手機站

        領取全套視頻
        千鋒教育

        關注千鋒學習站小程序
        隨時隨地免費學習課程

        當前位置:首頁  >  技術干貨  > hive自定義函數(shù)的那點事

        hive自定義函數(shù)的那點事

        來源:千鋒教育
        發(fā)布人:小千
        時間: 2021-01-07 10:44:00 1609987440

        經(jīng)常有學習大數(shù)據(jù)的小伙伴問小千,hive應該如何去自定義函數(shù)?小千今天就來給大家分享一下hive自定義函數(shù)的教程,繼續(xù)往下看。

        一、自定義函數(shù)

        1 為什么需要自定義函數(shù)

        hive的內置函數(shù)滿足不了所有的業(yè)務需求。

        hive提供很多的模塊可以自定義功能,比如:自定義函數(shù)、serde、輸入輸出格式等。

        2 常見自定義函數(shù)有哪些

         

        UDF:用戶自定義函數(shù),user defined function。一對一的輸入輸出。(最常用的)。

        UDTF:用戶自定義表生成函數(shù)。user defined table-generate function.一對多的輸入輸出。lateral view explode

        UDAF:用戶自定義聚合函數(shù)。user defined aggregate function。多對一的輸入輸出 count sum max。

        二、自定義函數(shù)實現(xiàn)

        1 UDF格式

        先在工程下新建一個pom.xml,加入以下maven的依賴包 請查看code/pom.xml

        定義UDF函數(shù)要注意下面幾點:

        繼承org.apache.hadoop.hive.ql.exec.UDF

        重寫evaluate(),這個方法不是由接口定義的,因為它可接受的參數(shù)的個數(shù),數(shù)據(jù)類型都是不確定的。Hive會檢查UDF,看能否找到和函數(shù)調用相匹配的evaluate()方法

        1.1 自定義函數(shù)第一個案例

        1

        2 函數(shù)加載方式

        2.1 命令加載

        這種加載只對本session有效

        # 1、將編寫的udf的jar包上傳到服務器上,并且將jar包添加到hive的class path中

        # 進入到hive客戶端,執(zhí)行下面命令

        add jar /hivedata/udf.jar

        # 2、創(chuàng)建一個臨時函數(shù)名,要跟上面hive在同一個session里面:

        create temporary function toUP as 'com.qf.hive.FirstUDF';

        3、檢查函數(shù)是否創(chuàng)建成功

        show functions;

        4. 測試功能

        select toUp('abcdef');

        5. 刪除函數(shù)

        drop temporary function if exists tolow;

        2.2 啟動參數(shù)加載

        (也是在本session有效,臨時函數(shù))

        2

        2.3 配置文件加載

        通過配置文件方式這種只要用hive命令行啟動都會加載函數(shù)

        3

        3 UDTF格式

        UDTF是一對多的輸入輸出,實現(xiàn)UDTF需要完成下面步驟

        繼承org.apache.hadoop.hive.ql.udf.generic.GenericUDF,

        重寫initlizer()、getdisplay()、evaluate()。

        執(zhí)行流程如下:

        UDTF首先會調用initialize方法,此方法返回UDTF的返回行的信息(返回個數(shù),類型)。

        初始化完成后,會調用process方法,真正的處理過程在process函數(shù)中,在process中,每一次forward()調用產(chǎn)生一行;如果產(chǎn)生多列可以將多個列的值放在一個數(shù)組中,然后將該數(shù)組傳入到forward()函數(shù)。

        最后close()方法調用,對需要清理的方法進行清理。

        3.1 需求:

        把"k1:v1;k2:v2;k3:v3"類似的的字符串解析成每一行多行,每一行按照key:value格式輸出

        3.2 源碼

        自定義函數(shù)如下:

        4

        3.3 打包加載

        對上述命令源文件打包為udf.jar,拷貝到服務器的/hivedata/目錄

        在Hive客戶端把udf.jar加入到hive中,如下:

        add jar /hivedata/udf.jar;

        3.4 創(chuàng)建臨時函數(shù):

        在Hive客戶端創(chuàng)建函數(shù):

        5

        3.5 測試臨時函數(shù)

        select parseMap("name:zhang;age:30;address:shenzhen")

        結果如下:

        6

        4 UDAF格式

        用戶自定義聚合函數(shù)。user defined aggregate function。多對一的輸入輸出 count sum max。定義一個UDAF需要如下步驟:

        UDF自定義函數(shù)必須是org.apache.hadoop.hive.ql.exec.UDAF的子類,并且包含一個火哥多個嵌套的的實現(xiàn)了org.apache.hadoop.hive.ql.exec.UDAFEvaluator的靜態(tài)類。

        函數(shù)類需要繼承UDAF類,內部類Evaluator實UDAFEvaluator接口。

        Evaluator需要實現(xiàn) init、iterate、terminatePartial、merge、terminate這幾個函

        這幾個函數(shù)作用如下:

        函數(shù)說明init實現(xiàn)接口UDAFEvaluator的init函數(shù)iterate每次對一個新值進行聚集計算都會調用,計算函數(shù)要根據(jù)計算的結果更新其內部狀態(tài)terminatePartial無參數(shù),其為iterate函數(shù)輪轉結束后,返回輪轉數(shù)據(jù)merge接收terminatePartial的返回結果,進行數(shù)據(jù)merge操作,其返回類型為boolean。terminate返回最終的聚集函數(shù)結果。

        4.1 需求

        計算一組整數(shù)的最大值

        4.2 代碼

        7

        4.3 打包加載

        對上述命令源文件打包為udf.jar,拷貝到服務器的/hivedata/目錄

        在Hive客戶端把udf.jar加入到hive中,如下:

        add jar /hivedata/udf.jar;

        4.4 創(chuàng)建臨時函數(shù):

        在Hive客戶端創(chuàng)建函數(shù):

        8

        3.5 測試臨時函數(shù)

        select maxInt(mgr) from emp

        結果如下:

        9

        最后歡迎大家添加我們的大數(shù)據(jù)技術分享交流qq群:857910996  加群找群管理免費領取大數(shù)據(jù)學習資料和項目源碼,趕緊來等你哦~~~~

        tags:
        聲明:本站稿件版權均屬千鋒教育所有,未經(jīng)許可不得擅自轉載。
        10年以上業(yè)內強師集結,手把手帶你蛻變精英
        請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
        免費領取
        今日已有369人領取成功
        劉同學 138****2860 剛剛成功領取
        王同學 131****2015 剛剛成功領取
        張同學 133****4652 剛剛成功領取
        李同學 135****8607 剛剛成功領取
        楊同學 132****5667 剛剛成功領取
        岳同學 134****6652 剛剛成功領取
        梁同學 157****2950 剛剛成功領取
        劉同學 189****1015 剛剛成功領取
        張同學 155****4678 剛剛成功領取
        鄒同學 139****2907 剛剛成功領取
        董同學 138****2867 剛剛成功領取
        周同學 136****3602 剛剛成功領取
        相關推薦HOT
        隆化县| 黄骅市| 德令哈市| 舟山市| 安国市| 齐河县| 合阳县| 景泰县| 海阳市| 鄂伦春自治旗| 永兴县| 抚州市| 江山市| 二连浩特市| 乌审旗| 佛学| 犍为县| 浮梁县| 商都县| 吉首市| 铁力市| 醴陵市| 泸西县| 荣成市| 关岭| 曲沃县| 徐闻县| 定日县| 左权县| 阿城市| 朝阳县| 潞城市| 枣阳市| 石门县| 山阴县| 腾冲县| 柘荣县| 道孚县| 三明市| 潜江市| 河源市|