去年年底出的一本学习Spark大数据的教程,文笔上言简意赅,只讲最常用的内容,很适合入门学习。是面向Spark开发者的一本实用参考书,结合实例全面系统的介绍了Spark工具的开发与使用。全书包括五章内容,第一章介绍Spark生态圈以及Spark RDD 的编程模型等内容;第二章介绍Spark RDD实战案例与解析,包含Spark应用程序的部署、Spark的各种应用案例与解析、Spark API的应用案例与解析以及Spark 应用程序的构建等内容;第三章介绍Spark SQL实战案例与解析,包含DataFrame的应用案例与解析、各种数据源的应用案例与解析等内容;第四章介绍Spark Streaming实战案例与解析,包含实时流各种数据源的应用案例与解析以及性能调优的简单介绍等内容;第五章介绍了与Spark密切相关的内存存储文件系统Tachyon实战案例与解析,主要包含了Tachyon的部署、Tachyon的各种应用案例与解析,最后给出构建在Tachyon上的Spark应用案例。

wKioL1dqCASQiZDzAAVI97-g-Og467.jpg-wh_50