设为首页收藏本站

小牛社区-大数据学习交流社区|大数据免费学习资源

 找回密码
 立即注册!

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 129|回复: 0

[电子书]HighPerformanceSpark完整版PDF下载

[复制链接]

118

主题

0

帖子

22

积分

吃土小白

Rank: 1

积分
22
发表于 2017-10-24 16:28:31 | 显示全部楼层 |阅读模式
  如果你使用ApacheSpark解决了中等规模数据的问题,但是在海量数据使用Spark的时候还是会遇到各种问题。High Performance Spark将会向你展示如何使用Spark的高级功能,所以你可以超越新手级别。本书适合软件工程师、数据工程师、开发者以及Spark系统管理员的使用。本书全名High Performance Spark:Best Practices for Scaling and Optimizing Apache Spark,作者Holden Karau, Rachel Warren,由O'Reilly于2017年05月出版,全书358页;《[电子书]High Performance Spark下载》文章提供的是本书预览版,只提供前四章,共91页,本文提供了本书的完整版。通过本书你可以学到: 
了解如何使Spark作业运行速度更快;  使用Spark探索数据;  使用Spark处理更大的数据集;  减少管道运行时间以获得更快的洞察力。 

如果想及时了解Spark、Hadoop或者Hbase相关的文章,欢迎关注微信公共帐号:iteblog_hadoop 
本书的章节 
Chapter 1 Introduction to High Performance Spark 
Chapter 2 How Spark Works 
Chapter 3 DataFrames, Datasets & Spark SQL 
Chapter 4 Joins (SQL & Core) 
Chapter 5 Effective Transformations 
Chapter 6 Working with Key/Value Data 
Chapter 7 Going Beyond Scala 
Chapter 8 Testing & Validation 
Chapter 9 Spark Components and Packages 
Append ix Spark Tuning and Cluster Sizing 
下载地址 
  提供了PDF、azw3 以及 epub 三种格式的下载。
点击进入下载
优秀人才不缺工作机会,只缺适合自己的好机会。但是他们往往没有精力从海量机会中找到最适合的那个。 
100offer 会对平台上的人才和企业进行严格筛选,让「最好的人才」和「最好的公司」相遇。 
注册 100offer,谈谈你对下一份工作的期待。一周内,收到 5-10 个满足你要求的好机会! 
本博客文章除特别声明,全部都是原创! 
禁止个人和公司转载本文、谢谢理解:过往记忆(http://www.iteblog.com/)
本文链接: 【[电子书]High Performance Spark完整版PDF下载】(http://www.iteblog.com/archives/1906.html)
<img alt="SosoImg"/>

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册!

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册!

本版积分规则

快速回复 返回顶部 返回列表