Hadoop大數據處理 (劉軍著) 中文pdf掃描版[84MB]
84.8MB / 12-14
Hadoop安全:大數據平臺隱私保護 中文完整pdf版[3MB]
3.22MB / 11-23
Hadoop大數據分析與挖掘實戰(zhàn) 完整pdf掃描版[52MB]
51.7MB / 11-13
Hadoop大數據視頻教程全集打包 含Scala、Spark視頻教程
20GB / 02-20
《Hadoop高級編程——構建與實現大數據解決方案》PDF版
7.35MB / 08-11
-
-
Zabbix v7.0使用手冊 中文版PDF 服務器 / 30MB
-
VMware vSphere 8.0.2全套中文手冊 官方PDF完整版 服務器 / 64.6MB
-
Nginx 安全配置指南技術手冊pdf版 服務器 / 488KB
-
DNS學習從入門到精通 完整PDF版 服務器 / 6.33MB
-
Windows Server 2016系統(tǒng)配置指南 完整pdf掃描版[155MB] 服務器 / 154.8MB
-
大型網站服務器容量規(guī)劃 中文pdf掃描版[145MB] 服務器 / 145MB
-
Windows Server 2016 Active Directory配置指南 中文PDF版 服務器 / 23.3MB
-
-
vSAN操作指南 中文PDF完整版 服務器 / 6.11MB
詳情介紹
《Hadoop大數據處理技術基礎與實踐》全書共有12章,從Hadoop起源開始,介紹了Hadoop的安裝和配置,并對Hadoop的組件分別進行了介紹,包括HDFS分布式存儲系統(tǒng),MapReduce計算框架,海量數據庫HBase,Hive數據倉庫,Pig、ZooKeeper管理系統(tǒng)等知識,最后對Hadoop實時數據處理技術作了簡單介紹,旨在讓讀者了解當前的其它的大數據處理技術。本書除了對Hadoop的理論進行說明之外,還對如何使用各組件進行了介紹,但介紹的只是基礎的使用,沒有涉及到底層的高級內容,所以本書只是起一個引導作用,旨在讓讀者了解Hadoop并能夠使用Hadoop的基本功能,并不是學習Hadoop的完全手冊。
本書適用于高等院校的學生;是云計算專業(yè)、物聯網專業(yè)及云計算與大數據專業(yè)的核心基礎課程,也是計算機相關專業(yè)的一門新增專業(yè)課或選修課;適合于零售及云計算與大數據技術相關的培訓班等使用。
目錄
Hadoop基礎與實踐
第1章Hadoop概述
1.1 Hadoop來源和動機
1.2 Hadoop體系架構
1.3 Hadoop與分布式開發(fā)
1.4 Hadoop行業(yè)應用案例分析
1.4.1 Hadoop在門戶網站的應用
1.4.2 Hadoop在搜索引擎中的應用
1.4.3 Hadoop在電商平臺中的應用
1.5小結
第2章Hadoop安裝與配置管理
2.1 實驗準備
2.2 配置一個單節(jié)點環(huán)境
2.2.1 運行一個虛擬系統(tǒng)CentOS
2.2.2 配置網絡
2.2.3創(chuàng)建新的用戶組和用戶
2.2.4上傳文件到CentOS并配置Java、Hadoop環(huán)境
2.2.5 修改Hadoop2.2配置文件
2.2.6修改CentOS主機名
2.2.7綁定hostname與IP
2.2.8關閉防火墻
2.3節(jié)點之間的免密碼通信
2.3.1什么是SSH
2.3.2 拷貝虛擬機節(jié)點
2.3.3 配置SSH免密碼登錄
2.4 Hadoop的啟動和測試
2.4.1 格式化文件系統(tǒng)
2.4.2啟動HDFS
2.4.3 啟動Yarn
2.4.4 管理JobHistory Server
2.4.5 集群驗證
2.4.6 需要了解的默認配置
2.5動態(tài)管理節(jié)點
2.5.1 動態(tài)增加和刪除datanode
2.5.2 動態(tài)修改TaskTracker
2.6小結
第3章HDFS技術
3.1HDFS的特點
3.2HDFS架構
3.2.1數據塊
3.2.2元數據節(jié)點與數據節(jié)點
3.2.3輔助元數據節(jié)點
3.2.4安全模式
3.2.5負載均衡
3.2.6垃圾回收
3.3HDFS Shell命令
3.3.1文件處理命令
3.3.2dfsadmin命令
3.3.3namenode命令
3.3.4fsck命令
3.3.5pipes命令
3.3.6job命令
3.4HDFS中Java API的使用
3.4.1上傳文件
3.4.2新建文件
3.4.3查看文件詳細信息
3.4.4下載文件
3.5RPC通信
3.5.1反射機制
3.5.2代理模式與動態(tài)代理
3.5.3Hadoop RPC機制與源碼分析
3.6小結
第4章Map/Reduce技術
4.1 什么是Map/Reduce
4.2 Map/Reduce編程模型
4.2.1 MapReduce編程模型簡介
4.2.2 Map/Reduce簡單模型
4.2.3 Map/Reduce復雜模型
4.2.4 Map/Reduce編程實例–WordCount
4.3 Map/Reduce數據流
4.3.1分片、格式化數據源(InputFormat)
4.3.2 Map過程
4.3.3 Shuffle過程
4.3.4 Reduce過程
4.3.5文件寫入(OutputFormat)
4.4 Map/Reduce任務流程
4.4.1 MRv2基本組成
4.4.2 Yarn基本組成
4.4.3 任務流程
4.5 Map/Reduce的Streaming和Pipe
4.5.1 Hadoop Streaming
4.5.2 Hadoop Pipe
4.6 Map/Reduce性能調優(yōu)
4.7Map/Reduce實戰(zhàn)
4.7.1 快速入門
4.7.2簡單使用Eclipse插件
4.8小結
第5章Hadoop I/O操作
5.1HDFS數據完整性
5.1.1校驗和
5.1.2DataBlockScanner
5.2基于文件的數據結構
5.2.1SequenceFile存儲
5.2.2MapFile
5.2.3SequenceFile轉換為MapFile
5.3壓縮
5.3.1Codec
5.3.2本地庫
5.3.3如何選擇壓縮格式
5.4序列化
5.4.1Writable接口
5.4.2WritableComparable
5.4.3Hadoop writable基本類型
5.4.4自定義writable類型
5.5小結
第6章海量數據庫HBase技術
6.1 初識HBase
6.2 HBase表視圖
6.2.1概念視圖
6.2.2物理視圖
6.3HBase物理存儲模型
6.4安裝HBase
6.4.1HBase單節(jié)點安裝
6.4.2HBase偽分布式安裝
6.4.3HBase完全分布式安裝
6.5HBaseShell
6.5.1general一般操作
6.5.2ddl操作
6.5.3dml操作
6.5.4小結
6.6小結
第7章ZooKeeper技術
7.1 分布式協調技術
7.2 實現者
7.3 角色
7.4 ZooKeeper數據模型
7.4.1Znode
7.4.2ZooKeeper中的時間
7.4.3ZooKeeper節(jié)點屬性
7.4.4watch觸發(fā)器
7.5 ZooKeeper集群安裝
7.6 ZooKeeper主要Shell操作
7.7 典型運用場景
7.7.1數據發(fā)布與訂閱
7.7.2統(tǒng)一命名服務(Name Service)
7.7.3分布通知/協調(Distribution of notification/coordination)
7.8小結
第8章分布式數據倉庫技術Hive
8.1 Hive出現原因
8.2 Hive服務組成
8.3 Hive安裝
8.3.1 Hive基本安裝
8.3.2 MySQL安裝
8.3.3 Hive配置
8.4 Hive Shell介紹
8.5HiveQL詳解
8.5.1 Hive管理數據方式
8.5.2 Hive表DDL操作
8.5.3 Hive表DML操作
8.6小結
第9章分布式數據分析工具Pig
9.1 Pig的安裝和配置
9.2 Pig基本概念
9.3 Pig保留關鍵字
9.4使用Pig
9.4.1 Pig命令行選項
9.4.2 Pig的兩種運行模式
9.4.3 Pig相關Shell命令詳解
9.4.4Pig程序運行方式
9.4.5 Pig輸入與輸出
9.5模式(Schemas)
9.6 Pig相關函數詳解
9.7小結
第10章 Hadoop與RDBMS數據遷移工具Sqoop
10.1 Sqoop基本安裝
10.2 Sqoop配置
10.3 Sqoop相關功能
10.4 Hive、Pig和Sqoop三者之間的關系
10.5小結
第11章Hadoop1.x與Hadoop2.x的比較
11.1 Hadoop發(fā)展歷程
11.2 Hadoop1.x與Hadoop2.x之間的差異
11.2.1 Hadoop1與Hadoop2體系結構對比
11.2.2 Hadoop1與Hadoop2之間配置差異
11.2.3 Hadoop2的Yarn框架
11.2.4 HDFS聯邦機制(Federation)
11.3小結
第12章Hadoop實時數據處理技術
12.1 Storm-Yarn
12.1.1 Apache Storm組成結構
12.1.2 Storm數據流
12.1.3 Storm-Yarn產生背景
12.1.4 Storm-Yarn功能介紹
12.2 Apache Spark
12.2.1 Apache Spark組成結構
12.2.2 Apache Spark擴展功能
12.3 Storm與Spark的比較
12.4小結
附錄一:使用Eclipse提交Hadoop任務相關錯誤解決
附錄二:常用Pig內置函數簡介
下載地址
人氣書籍
決戰(zhàn)Nginx系統(tǒng)卷:高性能Web服務器詳解與運維 PDF掃描版[94MB]
Tomcat權威指南(第2版) PDF掃描版
Hadoop實戰(zhàn)(第2版)陸嘉恒著 PDF掃描版
Nginx高性能Web服務器詳解 pdf掃描版[178MB]
精通Windows Server 2008 R2 PDF掃描版[157MB]
大規(guī)模Web服務開發(fā)技術 PDF掃描版[14MB]
Hadoop應用開發(fā)技術詳解 pdf掃描版
深入剖析Tomcat (Paul Deck) pdf掃描版
Windows Server 2012 Hyper-V虛擬化管理實踐 PDF掃描版[223MB]
學習Nginx HTTP Server(中文版) PDF掃描版[23MB]
下載聲明
☉ 解壓密碼:chabaoo.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請在評論中留言,我們會盡快修復,謝謝!
☉ 下載本站資源,如果服務器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請評論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學習研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的Hadoop大數據處理技術基礎與實踐 完整pdf掃描版[7MB] 資源來源互聯網,版權歸該下載資源的合法擁有者所有。