一本深入介绍原理和实现的书,很值得推荐
这本书很具体的从代码切入,介绍spark的各个组件,前面章节总结概括基本搭建和原理架构等,后面横向的从各个模块触发,比如SparkContext,BlockManager, Memstore以及上层的任务提交,RDD模式的开发和实践,介绍的比较具体。推荐给对spark稍有了解,想深入代码原理的人,源码之前。一切都是透明的。后面的章节追加了Mlib、GraphX、StreamingSql等应用场景,对数据开发也有帮助,很赞!
有关键情节透露