久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > 大數(shù)據(jù)技術(shù)-hive窗口函數(shù)詳解

大數(shù)據(jù)技術(shù)-hive窗口函數(shù)詳解

來源:千鋒教育
發(fā)布人:小千
時間: 2021-06-09 09:26:00 1623201960

      有不少同學(xué)一聽這個標(biāo)題,hive窗口函數(shù)是什么鬼?沒聽說過還有窗口函數(shù)這個東西啊,其實它的用處可大了,下面聽小千慢慢道來。

      hive窗口函數(shù)

      窗口函數(shù)指定了函數(shù)工作的數(shù)據(jù)窗口大小(當(dāng)前行的上下多少行),這個數(shù)據(jù)窗口大小可能會隨著行的變化而變化。

      窗口函數(shù)和聚合函數(shù)區(qū)別

      窗口函數(shù)對于每個組返回多行,組內(nèi)每一行對應(yīng)返回一行值。聚合函數(shù)對于每個組只返回一行。

      在日常的開發(fā)中常用那些類型函數(shù)??

      1、字符串操作函數(shù)?split、concat、ifnull、cast

      2、聚合函數(shù) : hive適用于分析,所以常用。

      3、時間函數(shù) : 數(shù)倉的特征隨時間變化而變化,所以時間也特別多

      4、窗口函數(shù):sum() over() 、 count() over() 、 排名函數(shù)

      了解哪些窗口函數(shù),都是什么意思?

      sum(col) over() :  分組對col累計求和

      count(col) over() : 分組對col累計

      min(col) over() : 分組對col求最小

      max(col) over() : 分組求col的最大值

      avg(col) over() : 分組求col列的平均值

      first_value(col) over() : 某分區(qū)排序后的第一個col值

      last_value(col) over() : 某分區(qū)排序后的最后一個col值 lag(col,n,DEFAULT) : 統(tǒng)計往前n行的col值,n可選,默認(rèn)為1,DEFAULT當(dāng)往上第n行為NULL時候,取默認(rèn)值,如不指定,則為NULL

      lead(col,n,DEFAULT) : 統(tǒng)計往后n行的col值,n可選,默認(rèn)為1,DEFAULT當(dāng)往下第n行為NULL時候,取默認(rèn)值,如不指定,則為NULL

      ntile(n) : 用于將分組數(shù)據(jù)按照順序切分成n片,返回當(dāng)前切片值。注意:n必須為int類型。

      over(分組 排序 窗口) 中的order by后的語法: 1、物理窗口(真實往上下移動多少行rows between):

      CURRENT ROW | UNBOUNDED PRECEDING | [num] PRECEDING AND UNBOUNDED FOLLOWING | [num] FOLLOWING| CURRENT ROW

      如: over(partition by col order by rows between 1 preceding and 1 fllowing)

1

      邏輯窗口(滿足條件上下多少行):(金融行業(yè)、保險行業(yè)、p2p等)

      range between [num] PRECEDING AND [num] FOLLOWING

      如: over(partition by col order by range between 5 preceding and 5 fllowing)

2

      注意:窗口函數(shù)一般不和group by搭配使用。

      以上就是關(guān)于大數(shù)據(jù)hive窗口函數(shù)的介紹了,最后歡迎對大數(shù)據(jù)感興趣的同學(xué)了解一下我們的大數(shù)據(jù)開發(fā)培訓(xùn)課程,內(nèi)容包含Linux&&Hadoop生態(tài)體系、大數(shù)據(jù)計算框架體系、云計算體系、機(jī)器學(xué)習(xí)&&深度學(xué)習(xí)。現(xiàn)在咨詢還能免費(fèi)領(lǐng)取大數(shù)據(jù)學(xué)習(xí)資料,趕緊來找在線老師申領(lǐng)吧。

tags:
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
oracle怎么樣實現(xiàn)數(shù)據(jù)庫跨機(jī)房同步?

一、oracle怎么樣實現(xiàn)數(shù)據(jù)庫跨機(jī)房同步除了使用第三方工具,Oracle提供了extended cluster可以實現(xiàn)類似的功能,使用Oracle RAC + ASM。簡單說下...詳情>>

2023-10-14 01:57:43
web網(wǎng)站性能測試的常用指標(biāo)有哪些?

一、頁面加載時間頁面加載時間是衡量網(wǎng)站性能的重要指標(biāo)之一,它指的是從用戶請求一個頁面到頁面完全加載完成所需的時間。頁面加載時間的長短直...詳情>>

2023-10-14 01:50:34
MySQL索引為什么能讓查詢效率提高?

一、MySQL索引為什么能讓查詢效率提高DB在執(zhí)行一條Sql語句的時候,默認(rèn)的方式是根據(jù)搜索條件進(jìn)行全表掃描。如果我們對某一字段增加索引,查詢時...詳情>>

2023-10-14 01:38:15
什么是面向云原生系統(tǒng)的智能運(yùn)維?

一、云原生系統(tǒng)概述云原生系統(tǒng)是指在云計算環(huán)境下構(gòu)建和運(yùn)行的應(yīng)用程序系統(tǒng),具備高可用、彈性擴(kuò)展、靈活部署和自動化管理等特點(diǎn)。它采用容器化...詳情>>

2023-10-14 01:25:33
怎么提升excel數(shù)據(jù)表訪問運(yùn)算速度?

一、怎么提升excel數(shù)據(jù)表訪問運(yùn)算速度目前版本Excel最大列數(shù)為16384,沒有10w加。運(yùn)算速度和Excel中是否有公式、公式的復(fù)雜度、對象的對少、格...詳情>>

2023-10-14 01:22:48