過(guò)來(lái)人的職場(chǎng)經(jīng)驗(yàn),如何尋找適合自己的企業(yè)? 2022-09-14
但并不是所有人都足夠幸運(yùn),能夠快速找到適合自己的測(cè)試工作,如果當(dāng)你找到了其它平臺(tái)下的測(cè)試,也不用過(guò)于擔(dān)心,就像小編說(shuō)的,可能不同的項(xiàng)...詳情>
Flink是如何保證Exactly-once語(yǔ)義? 2022-09-02
Flink通過(guò)實(shí)現(xiàn)兩階段提交和狀態(tài)保存來(lái)實(shí)現(xiàn)端到端的一致性語(yǔ)義。分為以下幾個(gè)步驟: 開(kāi)始事務(wù)( beginTransaction ) 創(chuàng)建一個(gè)臨時(shí)文件夾,來(lái)寫(xiě)...詳情>
CEP復(fù)雜事件處理 2022-09-02
可以針對(duì)特定的要求進(jìn)行復(fù)雜事件處理。例如一個(gè)窗口中可以添加CEP功能,對(duì)多條件的數(shù)據(jù)進(jìn)行多次判斷,如果一旦達(dá)到標(biāo)準(zhǔn)就觸發(fā)次復(fù)雜事件詳情>
Flink 中的Watermark機(jī)制 2022-09-02
Watermark是一種衡量Event Time進(jìn)展的機(jī)制,可以設(shè)定延遲觸發(fā),Watermark是用于處理亂序事件的,而正確的處理亂序事件,通常用Watermark機(jī)制結(jié)...詳情>
Flink支持哪幾種重啟策略?分別如何配置? 2022-09-02
重啟策略種類(lèi):固定延遲重啟策略(Fixed Delay Restart Strategy)故障率重啟策略(Failure Rate RestartStrategy)無(wú)重啟策略(No Restart St...詳情>
Trigger條件觸發(fā)功能 2022-09-02
可以針對(duì)時(shí)間大小或者數(shù)據(jù)量充當(dāng)條件,在整個(gè)窗口未達(dá)到標(biāo)準(zhǔn)的時(shí)候,進(jìn)行任務(wù)執(zhí)行,觸發(fā)運(yùn)行Job。然后當(dāng)編寫(xiě)trigger后,就需要對(duì)流數(shù)據(jù)進(jìn)行判...詳情>
什么是ETL? 2022-09-02
1. Nginx的日志可以通過(guò)Flume抽取到HDFS上。2. Mysql的數(shù)據(jù)可以通過(guò) Sqoop 抽取到 Hive 中,同樣 Hive 的數(shù)據(jù)也可以通過(guò) Sqoop 抽取到 Mysql ...詳情>
遲到的數(shù)據(jù)該怎樣處理? 2022-09-02
一般的app數(shù)據(jù)采集可能會(huì)存在數(shù)據(jù)上報(bào)延時(shí),因此數(shù)據(jù)會(huì)存在兩個(gè)時(shí)間:數(shù)據(jù)生成的時(shí)間和服務(wù)器收到的時(shí)間。由于我們底層數(shù)據(jù)都是按時(shí)間來(lái)做天的...詳情>
ClickHouse支不支持更新? 2022-09-01
但不是真正的更新和刪除,使用:alter table xxx 實(shí)現(xiàn) 更新、刪除的數(shù)據(jù),只有在分片時(shí)才會(huì)真正的清理詳情>
Flume會(huì)不會(huì)發(fā)生數(shù)據(jù)重復(fù),解釋說(shuō)明?(常見(jiàn)) 2022-09-01
會(huì),我們?cè)讷@取Channel批次數(shù)據(jù)的時(shí)候,每個(gè)批次是基于一個(gè)事務(wù)性的,一旦發(fā)生宕機(jī)或者Flume進(jìn)行掛掉,那么就會(huì)回滾,數(shù)據(jù)寫(xiě)入失敗,下次再重...詳情>
熱問(wèn)標(biāo)簽 更多>>
熱問(wèn)TOP榜
在線提問(wèn)
專(zhuān)業(yè)導(dǎo)師線上坐鎮(zhèn),解答個(gè)性化學(xué)習(xí)難題
提交問(wèn)題