1. 首页 > 全网神秘学教程 > 身心灵魔法

《基于Hadoop的大数据分析和处理》魏祖宽【文字版_PDF电子书_推荐】_计算机类 (基于hadoop的毕业设计题目有哪些)

如何自学 占星术 占星教程网盘 塔罗牌教程百度网盘

《基于Hadoop的大数据分析和处理》魏祖宽【文字版_PDF电子书_推荐】

《基于Hadoop的大数据分析和处理》魏祖宽【文字版_PDF电子书_推荐】_计算机类 (基于hadoop的毕业设计题目有哪些)

内容简介:

本书基于云计算和大数据,介绍大数据处理和分析的技术,分为两部分。*部分介绍Hadoop基础知识,内容包括:Hadoop的介绍和集群构建、Hadoop的分部式系统架构、MapResrcce及其应用、Hadoop的版本特征及进化。第二部分以云计算为主题,详细论述利用Hadoop的大数据分析和处理工具,以及NoSQL技术,内容包括:云计算和Hadoop、Amazon服务中的MapResrcce应用、Hadoop应用下的大数据分析、NoSQL、HBase。本书不单纯地讲述理论和概念,而是基于目具体的工具和技术(Hadoop和NoSQL),利用大量实际案例,通过实际的操作和应用来组织大数据处理和分析技术,有利于读者从工程应用的角度进行实际掌握和利用。适合相关专业的本科生、研究生和软件工程师学习。

作者简介:

魏祖宽,男,电子科技大学教授,博士,韩国科技协会、中国计算机学会、日本电子电器协会会员。承担计算机以及软件学院的本科和研究生的数据库课程教学和实验教学,及云计算和大数据方面的新课。主持数据库应用、GIS应用等方面的应用课题10多项(国家自然基金委,省/市级科技局等科研项目,以及企业横向项目),现专注于云存储方面的应用科研项目。

目  录:

目 录

第1章 Hadoop的介绍和集群构建 2

1.1 Hadoop介绍 2

1.1.1 云计算和Hadoop 2

1.1.2 Hadoop的历史 4

1.2 Hadoop构建案例 6

1.2.1 欧美构建案例 6

1.2.2 韩国构建案例 7

1.3 构建Hadoop集群 8

1.3.1 分布式文件系统 8

1.3.2 构建Hadoop集群的准备事项 12

1.3.3 构建伪分布式 17

1.3.4 分布式集群(Cluster)构建 29

1.4 Hadoop界面 36

1.4.1 Hadoop分布式文件系统指令界面 36

1.5 总结 40

第2章 Hadoop分布式处理文件系统 41

2.1 Hadoop分布式文件系统的设计 42

2.2 概观Hadoop分布式文件系统的整体构造 43

2.3 Namenode的角色 44

2.3.1 元数据管理 44

2.3.2 元数据的安全保管——Edits和Fslmage文件及Secondary Namenode 49

2.3.3 Datanode管理 52

2.4 Datanode的角色 59

2.4.1 block管理 59

2.4.2 数据的复制和过程 61

2.4.3 Datanode添加 63

2.5 总结 65

第3章 大数据和MapResrcce 67

3.1 大数据的概要 68

3.1.1 大数据的概念 69

3.1.2 大数据的价值创造 69

3.2 MapResrcce 71

3.2.1 MapResrcce 示例:词频统计(Word Count) 71

3.2.2 MapResrcce开源代码:词频统计(Word Count)——Java基础 75

3.2.3 MapResrcce 开源代码:词频统计(Word Count)——Ruby语言基础 76

3.3 MapResrcce的结构 78

3.3.1 通过案例了解MapResrcce结构 79

3.3.2 从结构性角度进行的MapResrcce最优化方案 81

3.4 MapResrcce的容错性(Fault Tolerance) 85

3.5 MapResrcce的编程 86

3.5.1 搜索 86

3.5.2 排序 87

3.5.3 倒排索引 87

3.5.4 查找热门词 88

3.5.5 合算数字 89

3.6 构建Hadoop:通过MapResrcce的案例介绍 90

3.6.1 单词频率统计MapResrcce的编程 91

3.6.2 MapResrcce—用户界面 95

3.7 总结 99

第4章 Hadoop版本特征及进化 101

4.1 Hadoop 0.1x版本的API 103

4.2 Hadoop附加功能(append) 107

4.3 Hadoop安全相关功能 109

4.4 Hadoop 2.0.0 alpha 111

4.4.1 安装Hadoop 2.0.0 112

4.4.2 Hadoop分布式文件系统的更改 120

4.4.3 跨时代MapResrcce框架:YARN 128

4.5 总结 135

第5章 云计算和Hadoop 137

5.1 大规模Hadoop集群的构建和案例 138

5.2 云基础设施服务的登场 139

5.2.1 Amazon云服务 141

5.3 在Amazon EC2中构建Hadoop集群 156

5.3.1 Apache Whirr 156

5.3.2 构建Hadoop 集群 157

5.4 总结 160

第6章 Amazon Elastic MapResrcce的倍增利用 161

6.1 Amazon EMR的活用 162

6.1.1 Amazon EMR的概念 162

6.1.2 Amazon EMR的构造 162

6.1.3 Amazon EMR的特征 163

6.1.4 Amazon EMR的 Job Flow和Step 164

6.1.5 使用Amazon EMR前需要了解的事项 165

6.1.6 Amazon EMR的实战运用 170

6.2 总结 178

第7章 Hadoop应用下的大数据分析 179

7.1 Hadoop应用下的机器学习(Mahout) 180

7.1.1 设置及编译 181

7.1.2 K-means 聚类算法 183

7.1.3 基于矢量相似度的协同过滤 188

7.1.4 小结 194

7.2 基于Hadoop的统计分析Rhive(R and Hive) 195

7.2.1 R的设置及灵活运用 195

7.2.2 Hive的设置及灵活运用 198

7.2.3 RHive的设置及灵活运用 201

7.2.4 小结 207

7.3 利用Hadoop的图形数据处理Giraph 207

7.4 总结 216

第8章 数据中的DBMS,NoSQL 217

8.1 NoSQL出现背景:大数据和Web 2.0 218

8.1.1 基于Web 2.0的大数据的登场 218

8.1.2 基于大数据的NoSQL的登场 221

8.1.3 适合大数据和Web 2.0的数据库NoSQL 222

8.2 NoSQL的定义和类别特征 226

8.3 NoSQL数据模型概要和分类 229

8.4 NoSQL数据模型化 231

8.4.1 NoSQL数据模型化基本概念 232

8.4.2 一般的NoSQL建模方法 234

8.5 主要NoSQL的比较和选择 239

8.6 总结 241

第9章 Hbase:Hadoop中的NoSQL 243

9.1 Hadoop生态界中的HBase 244

9.2 HBase介绍 248

9.3 HBase数据模型 250

9.3.1 map 250

9.3.2 持续性(persistent) 250

9.3.3 分布性(distributed) 250

9.3.4 排序性(sorted) 250

9.3.5 多维性(multidimensional) 251

9.3.6 稀疏性(sparse) 254

9.4 HBase的数据库模式 255

9.5 HBase构造 259

9.6 HBase的构建及运行 261

9.7 HBase的扩展——DuoBase中的HBase 264

9.8 HBase的用户定义索引 266

9.8.1 HBase用户定义索引—HFile格式的扩展 267

9.8.2 HBase用户定义索引—Region的扩展 267

9.9 总结 270

《基于Hadoop的大数据分析和处理》魏祖宽【文字版_PDF电子书_下载】大小:8.72MB已经过安全软件检测无毒,请您放心下载。浏览器不支持脚本!购买本书:当当图书商城 | | 淘宝购书

有需要联系v;hx-hx4

摘要:《基于Hadoop的大数据分析和处理》魏祖宽【文字版_PDF电子书_推荐】_计算机类 是一本介绍大数据分析和处理的技术书籍。本书全面阐述了Hadoop的基本原理、架构以及其在大数据处理中的应用。同时,书中还介绍了大数据分析的相关算法和工具,帮助读者更好地理解和应用大数据分析技术。本文将从四个方面对该书进行详细阐述。

1、Hadoop的基本原理和架构

《基于Hadoop的大数据分析和处理》首先介绍了Hadoop的基本原理和架构。Hadoop是一个分布式计算框架,具有高容错性和可伸缩性。本书通过对Hadoop的组成部分(HDFS和MapResrcce)的详细解释,帮助读者理解Hadoop的基本工作原理。此外,书中还介绍了Hadoop的架构和各个组件之间的关系,使读者能够深入了解Hadoop的内部机制。

2、Hadoop在大数据处理中的应用

《基于Hadoop的大数据分析和处理》还详细介绍了Hadoop在大数据处理中的应用。大数据处理是当今互联网时代的重要挑战之一,而Hadoop作为一个开源的大数据处理框架,具有高效处理大规模数据的能力。本书通过实际案例和应用场景,展示了Hadoop在大数据处理中的应用,帮助读者了解如何使用Hadoop进行大数据分析和处理。

3、大数据分析的算法和工具

大数据分析不仅需要掌握大数据处理框架的原理和应用,还需要掌握相关的算法和工具。《基于Hadoop的大数据分析和处理》在第三部分详细介绍了大数据分析的算法和工具。本书涵盖了常用的大数据分析算法,如聚类分析、关联规则挖掘等,并配合实例进行讲解。此外,书中还介绍了一些大数据分析的工具和平台,帮助读者选择和使用适合自己需求的工具。

4、总结归纳

通过对《基于Hadoop的大数据分析和处理》的详细阐述,可以看出本书是一本全面介绍大数据分析和处理的技术书籍。书中对Hadoop的基本原理、架构和应用进行了深入讲解,帮助读者掌握Hadoop的工作原理和使用方法。同时,书中还介绍了大数据分析的算法和工具,为读者提供了实际操作的指导。总而言之,本书是一本值得推荐的计算机类书籍。

文章总结内容第一自然段

文章总结内容第二自然段

本文由nayona.cn整理

点击联系需要东西方神秘学学习资料,专业的咨询

本文采摘于网络,不代表本站立场,转载联系作者并注明出处: https://sm.nayona.cn/xinnengyuan/259175.html

联系我们

在线咨询:点击这里给我发消息

微信号:hx-hx3