书悦天下 -Hadoop数据分析
本书资料更新时间:2025-01-19 23:05:47

Hadoop数据分析 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线

Hadoop数据分析精美图片
》Hadoop数据分析电子书籍版权问题 请点击这里查看《

Hadoop数据分析书籍详细信息

  • ISBN:9787115479648
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2018-4
  • 页数:228
  • 价格:69.00元
  • 纸张:暂无纸张
  • 装帧:暂无装帧
  • 开本:暂无开本
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分
  • 豆瓣短评:点击查看
  • 豆瓣讨论:点击查看
  • 豆瓣目录:点击查看
  • 读书笔记:点击查看
  • 原文摘录:点击查看
  • 更新时间:2025-01-19 23:05:47

内容简介:

通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,第一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;第二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。


书籍目录:

前言  ix

第一部分 分布式计算入门

第1章 数据产品时代  2

1.1 什么是数据产品  2

1.2 使用Hadoop构建大规模数据产品  4

1.2.1 利用大型数据集  4

1.2.2 数据产品中的Hadoop  5

1.3 数据科学流水线和Hadoop生态系统  6

1.4 小结  8

第2章 大数据操作系统  9

2.1 基本概念  10

2.2 Hadoop架构  11

2.2.1 Hadoop集群  12

2.2.2 HDFS  14

2.2.3 YARN  15

2.3 使用分布式文件系统  16

2.3.1 基本的文件系统操作  16

2.3.2 HDFS文件权限  18

2.3.3 其他HDFS接口  19

2.4 使用分布式计算  20

2.4.1 MapReduce:函数式编程模型  20

2.4.2 MapReduce:集群上的实现  22

2.4.3 不止一个MapReduce:作业链  27

2.5 向YARN 提交MapReduce 作业  28

2.6 小结  30

第3章 Python 框架和Hadoop Streaming  31

3.1 Hadoop Streaming  32

3.1.1 使用Streaming在CSV 数据上运行计算  34

3.1.2 执行Streaming作业  38

3.2 Python 的MapReduce框架  39

3.2.1 短语计数  42

3.2.2 其他框架  45

3.3 MapReduce进阶  46

3.3.1 combiner  46

3.3.2 partitioner  47

3.3.3 作业链  47

3.4 小结  50

第4章 Spark内存计算  52

4.1 Spark基础  53

4.1.1 Spark栈  54

4.1.2 RDD  55

4.1.3 使用RDD 编程  56

4.2 基于PySpark的交互性Spark  59

4.3 编写Spark应用程序  61

4.4 小结  67

第5章 分布式分析和模式  69

5.1 键计算  70

5.1.1 复合键  71

5.1.2 键空间模式  74

5.1.3 pair与stripe  78

5.2 设计模式  80

5.2.1 概要  81

5.2.2 索引  85

5.2.3 过滤  90

5.3 迈向最后一英里分析  95

5.3.1 模型拟合  96

5.3.2 模型验证  97

5.4 小结  98

第二部分 大数据科学的工作流和工具

第6章 数据挖掘和数据仓  102

6.1 Hive 结构化数据查询  103

6.1.1 Hive 命令行接口(CLI)  103

6.1.2 Hive 查询语言  104

6.1.3 Hive 数据分析  108

6.2 HBase  113

6.2.1 NoSQL 与列式数据库  114

6.2.2 HBase 实时分析  116

6.3 小结  122

第7章 数据采集  123

7.1 使用Sqoop 导入关系数据  124

7.1.1 从MySQL 导入HDFS  124

7.1.2 从MySQL 导入Hive  126

7.1.3 从MySQL 导入HBase  128

7.2 使用Flume 获取流式数据  130

7.2.1 Flume 数据流  130

7.2.2 使用Flume 获取产品印象数据  133

7.3 小结  136

第8章 使用高级API 进行分析  137

8.1 Pig  137

8.1.1 Pig Latin  138

8.1.2 数据类型  142

8.1.3 关系运算符  142

8.1.4 用户定义函数  143

8.1.5 Pig 小结  144

8.2 Spark 高级API  144

8.2.1 Spark SQL  146

8.2.2 DataFrame  148

8.3 小结  153

第9章 机器学习  154

9.1 使用Spark 进行可扩展的机器学习  154

9.1.1 协同过滤  156

9.1.2 分类  161

9.1.3 聚类  163

9.2 小结  166

第10章 总结:分布式数据科学实战  167

10.1 数据产品生命周期  168

10.1.1 数据湖泊  169

10.1.2 数据采集  171

10.1.3 计算数据存储  172

10.2 机器学习生命周期  173

10.3 小结  175

附录A 创建Hadoop 伪分布式开发环境  176

附录B 安装Hadoop 生态系统产品  184

术语表  193

关于作者  211

关于封面  211


作者介绍:

Benjamin Bengfort

数据科学家,目前正在马里兰大学攻读博士学位,方向为机器学习和分布式计算;熟悉自然语言处理、Python数据科学、Hadoop和Spark分析等。

Jenny Kim

经验丰富的大数据工程师,不仅进行商业软件的开发,在学术界也有所建树,在海量数据、机器学习以及生产和研究环境的Hadoop实施方面有深入研究。目前就职于Cloudera的Hue团队。


出版社信息:

暂无出版社相关信息,正在全力查找中!


书籍摘录:

暂无相关书籍摘录,正在全力查找中!


在线阅读/听书/购买/PDF下载地址:

在线阅读地址:Hadoop数据分析在线阅读

在线听书地址:Hadoop数据分析在线收听

在线购买地址:Hadoop数据分析在线购买


原文赏析:

暂无原文赏析,正在全力查找中!


其它内容:

书籍介绍

通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,第一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;第二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。


书籍真实打分

  • 故事情节:9分

  • 人物塑造:9分

  • 主题深度:6分

  • 文字风格:3分

  • 语言运用:6分

  • 文笔流畅:7分

  • 思想传递:7分

  • 知识深度:6分

  • 知识广度:9分

  • 实用性:3分

  • 章节划分:5分

  • 结构布局:4分

  • 新颖与独特:9分

  • 情感共鸣:3分

  • 引人入胜:7分

  • 现实相关:4分

  • 沉浸感:4分

  • 事实准确性:4分

  • 文化贡献:5分


网站评分

  • 书籍多样性:3分

  • 书籍信息完全性:3分

  • 网站更新速度:6分

  • 使用便利性:4分

  • 书籍清晰度:5分

  • 书籍格式兼容性:3分

  • 是否包含广告:7分

  • 加载速度:6分

  • 安全性:9分

  • 稳定性:7分

  • 搜索功能:4分

  • 下载便捷性:4分


下载点评

  • 内容完整(72+)
  • 简单(316+)
  • 图文清晰(273+)
  • azw3(499+)
  • 中评(675+)
  • 差评(318+)
  • 差评少(312+)

下载评价

  • 网友 马***偲: ( 2025-01-16 06:37:28 )

    好 很好 非常好 无比的好 史上最好的

  • 网友 曾***文: ( 2024-12-20 16:28:51 )

    五星好评哦

  • 网友 陈***秋: ( 2025-01-07 23:55:07 )

    不错,图文清晰,无错版,可以入手。

  • 网友 薛***玉: ( 2025-01-14 21:02:12 )

    就是我想要的!!!

  • 网友 权***颜: ( 2024-12-26 17:31:22 )

    下载地址、格式选择、下载方式都还挺多的

  • 网友 谢***灵: ( 2025-01-16 15:05:10 )

    推荐,啥格式都有

  • 网友 石***烟: ( 2025-01-17 16:14:02 )

    还可以吧,毕竟也是要成本的,付费应该的,更何况下载速度还挺快的

  • 网友 孙***美: ( 2024-12-26 14:56:06 )

    加油!支持一下!不错,好用。大家可以去试一下哦

  • 网友 师***怀: ( 2024-12-23 22:48:51 )

    好是好,要是能免费下就好了

  • 网友 家***丝: ( 2025-01-06 17:03:23 )

    好6666666

  • 网友 通***蕊: ( 2024-12-24 19:19:34 )

    五颗星、五颗星,大赞还觉得不错!~~

  • 网友 习***蓉: ( 2024-12-29 08:46:42 )

    品相完美


随机推荐