hadoop可以解決什么問(wèn)題 2022-09-08
hadoop可以解決什么問(wèn)題?Hadoop用處主要有兩方面,其一是把單機(jī)的工作任務(wù)拆分,將之變?yōu)閰f(xié)同工作的集群;其二是可以用來(lái)解決逐漸增加的文件存...詳情>
怎么才能學(xué)好hadoop 2022-09-07
怎么才能學(xué)好hadoop?Hadoop是學(xué)好大數(shù)據(jù)必不可少的一環(huán),它幾乎和大數(shù)據(jù)是相互綁定的,誰(shuí)也離不開(kāi)誰(shuí)。那么怎么學(xué)Hadoop,其實(shí)就是Hadoop如何入...詳情>
Spark SQL 結(jié)構(gòu)化數(shù)據(jù)處理流程及原理是什么? 2022-09-05
在兼容 Hive 的早期版本的 Spark 中,我們可以在查詢中使用某些關(guān)鍵詞,這樣做是完全可行的。然而,這在 Spark SQL 3 中是不允許的,因?yàn)樗?..詳情>
Apache Spark與 Apache Hadoop數(shù)據(jù)科學(xué)工具有哪些區(qū)別? 2022-09-05
與 Apache Spark 一樣,它的安全性可以通過(guò)其他 Apache 實(shí)用程序進(jìn)一步提高。如果您是需要大量數(shù)據(jù)科學(xué)實(shí)用程序來(lái)存儲(chǔ)和處理大數(shù)據(jù)的數(shù)據(jù)科學(xué)...詳情>
大數(shù)據(jù)的核心架構(gòu)層是哪些 2022-09-05
這種即席查詢通常是現(xiàn)有的報(bào)表和數(shù)據(jù)共享層的數(shù)據(jù)并不能滿足他們的需求,需要從數(shù)據(jù)存儲(chǔ)層直接查詢。數(shù)據(jù)同步任務(wù)需要等數(shù)據(jù)分析任務(wù)完成后才...詳情>
Kafka Partition 如何保證副本數(shù)據(jù)的一致性 2022-08-31
為了保證可用性,Kafka 的分區(qū)是多副本的,可以在創(chuàng)建分區(qū)時(shí)通過(guò) replication-factor 參數(shù)指定該分區(qū)的副本數(shù),某一副本丟失并不會(huì)造成實(shí)際數(shù)...詳情>
Kafka如何在數(shù)據(jù)一致性和可用性做平衡的 2022-08-31
如果Leader失敗了,一個(gè)未完全同步數(shù)據(jù)的Replication被選擇為了Leader,數(shù)據(jù)是否會(huì)丟失呢這種情況下,數(shù)據(jù)會(huì)丟失,可以保證可用性,但是不能保...詳情>
Kafka ACK機(jī)制 2022-08-31
Producer只要收到一個(gè)分區(qū)副本成功寫入的通知就認(rèn)為推送消息成功了。這個(gè)副本必須是leader副本, 只有l(wèi)eader副本成功寫入了,Producer才會(huì)認(rèn)為...詳情>
消息系統(tǒng)Kafka筆試題:Kafka底層的文件存儲(chǔ)結(jié)構(gòu) 2022-08-29
如何根據(jù)Offset來(lái)查找一條消息: 根據(jù)指定的偏移量,使用二分法查詢定位出該偏移量對(duì)應(yīng)的消息所在的分段索引文件和日志數(shù)據(jù)文件。然后通過(guò)二分...詳情>
hiveSQL的分組topN問(wèn)題 2022-08-29
大數(shù)據(jù)(big data),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助...詳情>
熱問(wèn)標(biāo)簽 更多>>
熱問(wèn)TOP榜
在線提問(wèn)
專業(yè)導(dǎo)師線上坐鎮(zhèn),解答個(gè)性化學(xué)習(xí)難題
提交問(wèn)題