大數(shù)據(jù)從入門到精通,一套專業(yè)的學(xué)習(xí)路線是必不可少的,尤其是對于想要自學(xué)的同學(xué)來說,這個至關(guān)重要。千鋒老師經(jīng)過第五次迭代更新,整理了一套專業(yè)前沿的大數(shù)據(jù)學(xué)習(xí)路線,從零基礎(chǔ)開始的同學(xué),可以作為自己的學(xué)習(xí)參考。
大數(shù)據(jù)學(xué)習(xí)路線圖是分為五個大的階段的:
第一階段 Java語言基礎(chǔ)階段
1.1 Java編程語言基本概述
1.2 Java基礎(chǔ)語法
1.3 面向?qū)ο缶幊?/p>
1.4 面向?qū)ο蟾呒壘幊?/p>
1.5 Java中的常用類庫
1.6 枚舉和異常類
1.7 Java數(shù)據(jù)結(jié)構(gòu)和集合框架泛型
1.8 Java中的IO流
1.9 Java中的多線程
1.10 Java中網(wǎng)絡(luò)編程和反射
1.11 Java8新特性
1.12 Java基礎(chǔ)加強
第二階段 Linux系統(tǒng)&Hadoop生態(tài)體系
01 Linux入門
02 常用基本命令
03 系統(tǒng)管理
04 Linux操作增強
05 Linux shell編程
06 Hadoop生態(tài)
07 分布式系統(tǒng)概述
08 Hadoop入門
09 Hadoop偽分布式
10 Hadoop全分布式
11 HDFS基本概念
12 HDFS的應(yīng)用開發(fā)
13 HDFS的IO流操作
14 NameNode工作機制
15 DataNode工作機制
16 Zookeeper入門
17 Zookeeper詳解
18 HA框架原理
19 Hadoop-HA集群配置
20 MapReduce框架原理
21 Shuffle機制
22 Mapreduce案例一
23 Mapreduce案例二
24 Hive入門
25 Hive DDL數(shù)據(jù)定義
26 Hive分區(qū)表
27 Hive分桶表
28 Hive查詢
29 Hive的高級查詢Join與排序
30 Hive的函數(shù)
31 Hive DML數(shù)據(jù)管理
32 Hive文件存儲
33 Hive企業(yè)級調(diào)優(yōu)
34 Hive企業(yè)級調(diào)優(yōu)二
35 Hive企業(yè)級項目實戰(zhàn)
36 Flume詳解
37 Sqoop詳解
38 Hbase概念
39 Hbase的操作
40 Hbase整合
41 Hbase的實戰(zhàn)和優(yōu)化
第三階段 分布式計算框架
3.1 scala
3.2 Spark Core
3.3 Spark SQL
3.4 Spark Streaming
3.5 kafka
3.6 ElasticSearch
3.7 Logstash
3.8 Kibana
3.9 Kibana
第四階段 大數(shù)據(jù)實戰(zhàn)項目
4.1 互金領(lǐng)域-廣告投放
項目介紹:構(gòu)建廣告投放平臺,進行廣告投放業(yè)務(wù),吸引潛在客戶,推廣產(chǎn)品,包含投放微服務(wù)平臺、競價模塊、客戶群體畫像、 千人千面推薦產(chǎn)品。
4.2 電商平臺
項目介紹: 埋點業(yè)務(wù),進行用戶細分畫像、建立信用體系、進行線上各類活動。
4.3 共享單車
項目介紹: 依據(jù)用戶行為軌跡構(gòu)成出行規(guī)律,根據(jù)用戶群體出行規(guī)律、區(qū)域情況等動態(tài)調(diào)度用車情況。
4.4 工業(yè)大數(shù)據(jù)
項目介紹:國家電網(wǎng)_省級輸/變電監(jiān)控項目:監(jiān)控線路的傳感設(shè)備,確保設(shè)備安全、降低故障成本,動態(tài)監(jiān)控線路、變電站二次設(shè)備工作情況、報警自動化。
4.5 交通
項目介紹:貴州交通廳,交通離線/實時監(jiān)控項目:通過交通卡口采集實時數(shù)據(jù),動態(tài)監(jiān)控全省各道路通行和事故狀況,避免擁堵、避免交通事故、 精準測速、防止套牌和提供便捷最佳出行方案、 預(yù)測擁堵系數(shù),為各級提供最優(yōu)道路規(guī)劃方案。
4.6 旅游
項目介紹:安順智慧旅游,整合各類旅游相關(guān)應(yīng)用系統(tǒng)及信息資源,在公安、交通、工商等相關(guān)領(lǐng)域?qū)崿F(xiàn)信息共享、協(xié)同合作,共同打造良性的旅游云生態(tài)系統(tǒng)。
4.7 醫(yī)療
項目介紹:某市人民醫(yī)院,隨著老年化的持續(xù)增加,患病率越來越高。增加大數(shù)據(jù)平臺,采集醫(yī)療相關(guān)數(shù)據(jù),提高診斷的準確性,預(yù)防一些疾病的發(fā)生,監(jiān)控相關(guān)病情康復(fù)進展,真正實現(xiàn)解決看病難,降低發(fā)病率等。
第五階段 大數(shù)據(jù)分析
5.1 Data Analyze數(shù)據(jù)分析基礎(chǔ)
5.2 工作環(huán)境準備
5.3 數(shù)據(jù)可視化的概念與準則
5.4 Python機器學(xué)習(xí)
5.5 選擇模型
5.6 構(gòu)建樹的過程
5.7 網(wǎng)格搜索
5.8 sklearn中有三類樸素貝葉斯算法
5.9 顏色特征
5.10 手寫數(shù)字識別
5.11 文本的基本組成
5.12 文本的基本組成
學(xué)習(xí)大數(shù)據(jù)開發(fā),可以參考千鋒提供的大數(shù)據(jù)學(xué)習(xí)路線,該學(xué)習(xí)路線提供完整的大數(shù)據(jù)開發(fā)知識體系,內(nèi)容包含Linux&&Hadoop生態(tài)體系、大數(shù)據(jù)計算框架體系、云計算體系、機器學(xué)習(xí)&&深度學(xué)習(xí)。根據(jù)千鋒大數(shù)據(jù)培訓(xùn)提供的大數(shù)據(jù)學(xué)習(xí)路線圖可以讓你對學(xué)習(xí)大數(shù)據(jù)需要掌握的知識有個清晰的了解,并快速入門大數(shù)據(jù)開發(fā)。