title

基于企业案例实战深度剖析Spark内核Spark SQL\Streaming\GraphX\SparkR\机器学习

[复制链接]
发表于 2017-11-6 11:28:34 | 显示全部楼层 |阅读模式
顺应人群:
Java开辟经历或Scala开辟经历,较好领会Hadoop,Hive等利用经历。课程对于Spark初学者,Spark开辟职员及Spark运维职员都具有比力大的进修代价。
课程方针:
深入了解Spark的运转道理
学会搭建Spark,hadoop集群情况
完全把握Spark编程根本,领会Spark运维的根本常识
完成大数据入门,可逐步转岗大数据相关职位。
课程情况:
预备情况:CentOS,eclipse或IntelliJ IDEA, Scala,JDK,Maven,sbt,Hadoop,hive,倡议三台虚拟机。

课程简介:

本课程将会连系精典案例讲授Spark Job的全部生命周期,以及若何分别Stage,若何天生逻辑履行计划和物理履行计划。从Hash Shuffle到Sort Shuffle再到Tungsten Sort Shuffle具体分析Spark Shuffle机制的道理与演进,同时连系Yarn分析Spark的内存模子以及若何停止相关调优,其中两节课首要先容Spark Streaming利用方式,分析通用流式处置系统的关键题目以及Spark Streaming对响应题目标处理计划,如窗口,乱序,Checkpoint等,并分析Spark Streaming与Storm和Kafka Stream各自的优弱点和适用处景。

最初将连系源码分析Spark SQL的道理,以及实现SQL引擎的一般方式,先容若何停止Spark SQL性能优化。并连系大量实在案例,分析若何处理数据倾斜题目从而进步利用性能。
旅客,假如您要检察本帖隐藏内容请答复





回复

使用道具 举报

发表于 2018-10-26 15:25:16 | 显示全部楼层
let me see
回复

使用道具 举报

发表于 2018-11-14 17:38:19 | 显示全部楼层
学习学习学习学习学习学习
回复

使用道具 举报

发表于 2018-11-20 09:16:29 | 显示全部楼层
非常好非常好非常好非常好非常好非常好非常好
回复

使用道具 举报

发表于 2018-12-1 20:36:34 | 显示全部楼层
基于企业案例实战深度剖析Spark内核Spark SQL\Streaming\GraphX\SparkR\机器学习
回复

使用道具 举报

发表于 2019-2-23 21:57:42 | 显示全部楼层
看看,谢谢分享。看看,谢谢分享。看看,谢谢分享。看看,谢谢分享。看看,谢谢分享。
回复

使用道具 举报

发表于 2019-6-21 10:09:46 | 显示全部楼层
感谢分享,正好需要这个课程
回复

使用道具 举报

发表于 2019-12-7 04:10:06 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2020-1-29 15:22:33 | 显示全部楼层
基于企业案例实战深度剖析Spark内核Spark SQL\Streaming\GraphX\SparkR\机器学习
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表