大數(shù)據(jù)面試題:用戶畫像、推薦系統(tǒng)、Flink實時數(shù)倉、準實時數(shù)倉中常見問題都有什么? 2022-06-29
我們在選擇如何存儲用戶標簽時,遇到了問題(標簽查詢速度慢,并且構(gòu)建不夠靈活,標簽更新和刪除比較麻煩),比如之前用HDFS或者ES存儲,后來切...詳情>
大數(shù)據(jù)面試題:kafka詳解 2022-06-21
1.延遲隊列,重試隊列,死信隊列,延遲隊列:用戶登錄過時,訂單30分鐘自動取消;重試隊列:可以利用延遲隊列實現(xiàn),即該消息處理失敗后,多久...詳情>
大數(shù)據(jù)面試題:kafka 2022-06-21
在正常情況下,AR應該是和ISR一樣的,但是當某個Follower副本落后太多或者某個Follower副本節(jié)點掛掉了,那么它會被移出ISR放入OSR中,kafka的...詳情>
大數(shù)據(jù)面試題:hbase布隆過濾器 2022-06-21
對于hbase而言,當我們選擇采用布隆過濾器之后,HBase會在生成StoreFile(HFile)時包含一份布隆過濾器結(jié)構(gòu)的數(shù)據(jù),稱其為MetaBlock;MetaBlock與...詳情>
大數(shù)據(jù)面試題:hbase基礎 2022-06-21
列簇 :HBASE表中的每個列,都歸屬于某個列族。列族是表的schema的一部分(而列不是),必須在使用表之前定義。列名都以列族作為前綴。例如 cour...詳情>
大數(shù)據(jù)面試題:SQL 2022-06-21
數(shù)據(jù)傾斜怎么解決?1)key 盡量打亂;提高reduce任務數(shù);2)關聯(lián)查詢時,利用分桶和map-side提高查詢效率詳情>
大數(shù)據(jù)面試題:hive數(shù)據(jù)導入 2022-06-21
load data inpath '/hadoop/guozy/data/user.txt' into table external_table;此處是移動(非復制),移動數(shù)據(jù)非常快,不會對數(shù)據(jù)是否符合定義的...詳情>
大數(shù)據(jù)面試題:分區(qū)和分桶 2022-06-21
分區(qū)指的就是將數(shù)據(jù)按照表中的某一個字段進行統(tǒng)一歸類,并存儲在表中的不同的位置,也就是說,一個分區(qū)就是一類,這一類的數(shù)據(jù)對應到hdfs存儲...詳情>
熱問標簽 更多>>
在線提問
專業(yè)導師線上坐鎮(zhèn),解答個性化學習難題
提交問題