HDFS筆記
Hadoop 分布式 文件系統(tǒng)。特點(diǎn):性能高、效率高、速度快 可以在廉價(jià)的機(jī)器上運(yùn)行的 可容錯(cuò) 文件系統(tǒng)。 當(dāng)集群中有機(jī)器掛掉時(shí),HDFS會(huì)自動(dòng)將掛掉的機(jī)器上的任務(wù)分配給正常的機(jī)器,使任務(wù)繼續(xù)保持正常工作。
,Chukwa Chukwa可以將各種各樣類型的數(shù)據(jù)收集成適合Hadoop處理的文件保存在HDFS中供Hadoop進(jìn)行各種MapReduce操作。Chukwa本身也提供了很多內(nèi)置的功能,幫助我們進(jìn)行數(shù)據(jù)的收集和整理。
所以Hive是用進(jìn)行數(shù)據(jù)提取轉(zhuǎn)換加載的,而且它可以把SQL轉(zhuǎn)換為MapReduce任務(wù),而Hive的表就是HDFS的目錄或者文件。
Java的學(xué)習(xí)課程:對Java有基本認(rèn)知。學(xué)習(xí)Java基礎(chǔ),包括Java語言、Java語法和各種基本算法,了解代碼從寫好到實(shí)現(xiàn)之間的流程。數(shù)據(jù)庫開發(fā),主要包括SQL基礎(chǔ)、JDBC編程和JDBC高級(jí)應(yīng)用。
一邊看視頻,一邊記筆記,把重點(diǎn)都記下來,還一邊跟著老師敲代碼,為了能盡早學(xué)會(huì)Java。每天都堅(jiān)持學(xué)5-6個(gè)小時(shí)。經(jīng)常學(xué)到晚上一點(diǎn)多才睡覺。星期六,日不用上班,每天7點(diǎn)多起床,學(xué)到晚上11,12點(diǎn)。
cs201 全棧軟件工程師免費(fèi)下載 鏈接:https://pan.baidu.com/s/1uvC9DjwH3O3qemDwhmO_OA 提取碼:djxg 全棧工程師是指掌握多種技能,勝任前端與后端,能利用多種技能獨(dú)立完成產(chǎn)品的人。
hadoop常用shell命令怎么用
使用方法:hadoop fs -cat URI [URI …]將路徑指定文件的內(nèi)容輸出到stdout。
root用戶根目錄下的.profile文件)-input,-output這是都是執(zhí)行hadoop命令的參數(shù)。
hadoop查看每個(gè)目錄的路徑需要驗(yàn)證數(shù)據(jù)。點(diǎn)擊shell命令,hadoopfscountq目錄ps,查看目錄下總的大小。dfscount目錄ps,一樣的,hadoopfsdu目錄ps,查看目錄下每個(gè)子目錄的路徑。
常見的在偽分布式環(huán)境下使用的Shell命令包括:start-dfs.sh啟動(dòng)分布式文件系統(tǒng)、start-yarn.sh啟動(dòng)資源管理器、hadoop fs操作分布式文件系統(tǒng)、hadoop jar運(yùn)行Hadoop任務(wù)等。
打開Linux終端,輸入以下命令來創(chuàng)建一個(gè)用戶。su password:useradd hadoop passwd hadoop New passwd:Retype new passwd SSH設(shè)置和密鑰生成 SSH設(shè)置需要在集群上做不同的操作,如啟動(dòng),停止,分布式守護(hù)shell操作。
完成Hadoop的安裝以后,再安裝Spark(Local模式)。使用hadoop用戶名登錄進(jìn)入Linux系統(tǒng),啟動(dòng)Hadoop,參照相關(guān)Hadoop書籍或網(wǎng)絡(luò)資料,或者也可以參考本教程官網(wǎng)的“實(shí)驗(yàn)指南”欄目的“HDFS操作常用Shell命令”。
如何在linux腳本中執(zhí)行hdfs命令
1、通過“-get 文件按1 文件2”命令將HDFS中某目錄下的文件復(fù)制到本地系統(tǒng)的某文件中,并對該文件重新命名。
2、打開Vmware虛擬機(jī),打開三個(gè)虛擬機(jī)。打開SecureCRT軟件,分別連接到三個(gè)虛擬機(jī)中,在其中書寫linux命令。在master虛擬機(jī)中,進(jìn)入hadoop/bin目錄。
3、實(shí)驗(yàn):在master上執(zhí)行 ssh hadoop2 實(shí)現(xiàn)無密碼登陸。3 配置Hadoop 1拷貝hadoop 將hadoop-0.tar.gz ,拷貝到usr/local 文件夾下,然后解壓。
4、HDFS支持權(quán)限控制,但支持較弱。HDFS的設(shè)計(jì)是基于POSIX模型的,支持按用戶、用戶組、其他用戶的讀寫執(zhí)行控制權(quán)限。
5、安裝hadoop 1 因?yàn)閔adoop是基于java的,所以要保證hadoop能找到在本地系統(tǒng)中大路徑,即正確設(shè)置java的環(huán)境變量。