- A+
目录【点击切换】
Hadoop大数据开发实战简介
互联网 类型 可以朗读 语音朗读 221千字 字数 2011 发行日期
主编推荐语
Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。
内容简介
本书将大数据技术生态圈主流技术框架的应用与发展、搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS(Hadoop Distributed File System)、大数据分布式并行计算框架MapReduce、大数据汽车销售数据统计分析项目5大模块分为11章内容进行阐述。具体分布情况如下:第1章是大数据概论,介绍大数据的发展背景及基本概念;第2章是搭建Hadoop分布式集群;第3~6章是HDFS分布式文件系统入门、HDFS接口、HDFS的运行机制、Hadoop I/O流操作;第7~10章是初识MapReduce编程模型、MapReduce应用编程开发、MapReduce编程案例、MapReduce运行机制与YARN平台;第11章是汽车销售数据统计分析项目实战。本书将理论与实践相结合,介绍了大数据的核心技术,并通过介绍一个企业的开发项目,深入讲解大数据技术在实际工作中的应用。
本书是为所有热爱大数据、打算从事大数据相关工作的读者而编写的,适合有Java编程基础的学习者参考使用,也适合作为高等院校、培训机构的大数据技术教材。
目录
- 版权信息
- 内容提要
- 前言
- 第1章 大数据概论
- 大数据的学习基础
- 大数据的背景
- 对大数据的不同认识
- 大数据的行业案例
- 大数据的基本概念
- 大数据技术生态圈
- 本章总结
- 本章习题
- 第2章 搭建Hadoop分布式集群
- 云平台
- 安装CentOS 6
- Linux系统配置
- Hadoop的配置部署
- 本章总结
- 本章习题
- 第3章 HDFS入门
- Hadoop分布式文件系统HDFS
- HDFS核心设计
- HDFS体系结构
- 本章总结
- 本章习题
- 第4章 HDFS接口
- HDFS命令行接口
- HDFS Java接口
- 本章总结
- 本章习题
- 第5章 HDFS的运行机制
- HDFS中数据流的读写
- HA机制
- Federation机制
- 本章总结
- 本章习题
- 第6章 Hadoop I/O流操作
- 数据完整性
- 压缩
- 序列化
- 基于文件的数据结构SequenceFile
- 本章总结
- 本章习题
- 第7章 初识MapReduce编程模型
- MapReduce编程框架
- WordCount编程实例
- Hadoop MapReduce架构
- 本章总结
- 本章习题
- 第8章 MapReduce应用编程开发
- MapReduce编程开发
- MapReduce在集群上的运作
- MapReduce的类型与格式
- 本章总结
- 本章习题
- 第9章 MapReduce编程案例
- 数据去重
- 数据排序
- 平均成绩
- 多表关联
- 二次排序
- 本章总结
- 本章习题
- 第10章 MapReduce运行机制与YARN平台
- 剖析MapReduce作业运行机制
- Shuffle和排序
- 任务的执行
- 作业的调度
- YARN平台简介
- YARN平台架构
- 本章总结
- 本章习题
- 第11章 汽车销售数据统计分析项目
- 数据概况
- 项目实战
- 本章总结
- 本章习题
评分及书评
评分不足
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。
喜欢这本书的也喜欢
关于Hadoop大数据开发实战的相关词
互联网书籍新月深化 | 有关互联网的创业计划书 |
互联网管理书籍 | 互联网推广书籍有哪些 |
互联网相关书籍推荐知乎 | 互联网金融平台排名 |
关于互联网的书有哪些 | 互联网营销师证书怎么考 |