开源力量Spark开发实战 Spark架构原理集群开发视频教程
课程名称: 开源力量Spark开发实战 Spark架构原理集群开发视频教程课程简介:
本课程内容主要包括Spark生态系统、Spark架构、Spark执行原理的概述,实际动手搭建Spark集群,同时学习Spark实时计算、Spark Streaming流式计算的多语言编程,最后学习Spark SQL、基于Spark的机器学习、图计算等相关内容。
课程背景
Hadoop在大数据领域应经证明了其存在的价值,在超大数据量时,Hadoop有着较高的优势。
但是在普通数据量实时计算上面还是差很多,因为Hadoop的设计导致数据计算具有较高的延迟,所以无法满足实时数据需求,而单机计算更没有办法满足,由此诞生了Spark,基于内存的分布式实时计算框架,在某些数据量情况下,Spark的计算性能超Hadoop百倍,而算法实现仅有其1/10,甚至更少,所有Spark未来会成为大数据领域一颗耀眼的明星!
课程大纲
第一周 Spark生态系统概述
1.Spark生态系统概述
2.BDAS
3.Spark运行模式
4.Spark核心内容
(1)RDD
(2)transformation
(3)action
5.lineage
6.容错处理
7.宽依赖与窄依赖
第二周 Spark运行、开发环境搭建
1.Hadoop2.x安装
2.spark源码编译
3.spark安装及测试
4.Spark on YARN
5.开发环境搭建
第三周 spark 编程
1.常用RDD
2.常用transformation
3.常用action
4.Scala、Python、JAVA多种语言编程实践
第四周 Spark Streaming概述及实践
1.DStream
2.数据源
3.transformation on DStreams
4.checkpoint
5.容错
6.编程实践
7.性能优化
----------------------课程目录------------------------------
│ 课时1:spark基本介绍,RDD操作方式.rar
│ 课时2:付费学员服务指引.rar
│ 课时3:学习资料.rar
│ 课时4:1.Spark基本介绍.rar
│ 课时5:2.Spark-RDD操作方式.rar
│ 课时6:3.spark容错、调度.rar
│ 课时7:1.spark安装基础,JDK、hadoop.rar
│ 课时8:2.scala、spark安装及测试.rar
│ 课时9:3.开发环境搭建.rar
│ 课时10:PPT课件
│ 课时11:学习资料课件
│ 课时12:1.RDD知识回顾.rar
│ 课时13:2.transformation实践操作.rar
│ 课时14:3.RDD之Transformation.rar
│ 课时15:4.RDD之action学习.rar
│ 课时16:PPT课件
│ 课时17:1.SparkStreaming.rar
│ 课时18:2.spark之transformation.rar
│ 课时19:3.sparkstreaming之Windowsoperations.rar
│ 课时20:4.sparkstreaming之transformoperations.rar
│ 课时21:5.sparkstreaming之outputoperation及代码优化点.rar
下载地址:**** Hidden Message *****
页:
[1]