请选择 进入手机版 | 继续访问电脑版
我的账户
学链

XEO教育区块链

亲爱的学员,欢迎!

已有账号,请

如尚未注册?

Spark 2.0从入门到精通:Scala编程

[复制链接]
于泽文 发表于 2018-1-28 19:43:15 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
Spark 2.0从入门到精通:Scala编程

本课程主要讲解目前大数据领域热门、火爆、有前景的技术——Spark。在本课程中,会从浅入深,基于大量案例实战,深度剖析和讲解Spark,并且会包含完全从企业真实复杂业务需求中抽取出的案例实战。

  • IT/互联网 » 数据处理

    课程分类

  • 155课时

    总课时

  • 中级

    课程难度

  • 您无权查看

    下载密码

课程试学目录
  • Scala编程详解:基础语法

  • Scala编程详解:条件控制与循环

  • Scala编程详解:函数入门之默认参数和带名参数

  • Scala编程详解:数组操作之Array、ArrayBuffer以及遍历数组

课程信息
本课程主要讲解目前大数据领域热门、火爆、有前景的技术——Spark。在本课程中,会从浅入深,基于大量案例实战,深度剖析和讲解Spark,并且会包含完全从企业真实复杂业务需求中抽取出的案例实战。课程会涵盖Scala编程详解、Spark核心编程、Spark SQL和Spark Streaming、Spark内核以及源码剖析、性能调优、企业级案例实战等部分。完全从零起步,让学员可以一站式精通Spark企业级大数据开发,提升自己的职场竞争力,实现更好的升职或者跳槽,或者从j2ee等传统软件开发工程师转型为Spark大数据开发工程师,或是对于正在从事hadoop大数据开发的朋友可以拓宽自己的技术能力栈,提升自己的价值。
1.课程研发环境
开发工具: Eclipse、Scala IDE for Eclipse;
Spark: 1.3.0和1.5.1
Hadoop: 2.4.1
Hive: 0.13
ZooKeeper: 3.4.5
Kafka: 2.9.2-0.8.1     
其他工具: SecureCRT、WinSCP、VirtualBox等
2.内容简介
本课程主要讲解的内容包括:Scala编程、Hadoop与Spark集群搭建、Spark核心编程、Spark内核源码深度剖析、Spark性能调优、Spark SQL、Spark Streaming。

本课程的特色包括:
1、代码驱动讲解Spark的各个技术点(绝对不是照着PPT空讲理论);
2、现场动手画图讲解Spark原理以及源码(绝对不是干讲源码和PPT);
3、覆盖Spark所有功能点(Spark RDD、Spark SQL、Spark Streaming,初级功能到高级特性,一个不少);
4、Scala全程案例实战讲解(近百个趣味性案例);
5、Spark案例实战的代码,几乎都提供了Java和Scala两个版本和讲解(一次性同时精通Java和Scala开发Spark);
6、大量全网独有的知识点:基于排序的wordcount,Spark二次排序,Spark分组取topn,DataFrame与RDD的两种转换方式,Spark SQL的内置函数、开窗函数、UDF、UDAF,Spark       Streaming的Kafka Direct API、updateStateByKey、transform、滑动窗口、foreachRDD性能优化、与Spark SQL整合使用、持久化、checkpoint、容错与事务。
7、多个从企业实际需求抽取出的复杂案例实战:每日uv和销售额统计案例、top3热卖商品统计案例、每日top3热点搜索词统计、广告计费日志实时黑名单过滤案例、热点搜索词滑动统       计案例、top3热门商品实时统计案例
8、深度剖析Spark内核源码与Spark Streaming源码,给源码进行详细的注释和讲解
9、全面讲解Spark、Spark SQL、Spark Streaming的性能调优,其中包括全网独有的Shuffle性能调优(详细讲解性能调优的各个技术点)
10、涵盖Spark两个重要版本,Spark 1.3.0和Spark 1.5.1的讲解(走在Spark前沿,涵盖新高级特性)


本次Spark 2.0课程升级,总计30讲内容,大约15个课时。主要是深入浅出讲解了Spark2.0版本的相关内容。主要内容大纲如下:
1. Spark 2.0新特性深入浅出剖析:主要讲解了Spark 2.0都有哪些新特性,同时深入浅出剖析了Spark 2.0的第二代Tungsten引擎的工作原理。
2. Dataset/Dataframe开发详解:主要完整讲解了Spark 2.0开始,API-Dataset/Dataframe的开发,包括主要的各种计算操作以及常用函数等。
3. Structured Streaming开发详解:主要深入浅出讲解了Spark 2.0新增加的下一代流式计算引擎——Structured Streaming,包括其设计理念和思想,以及开发模式,以及开发的一些细节。
4. Spark简历编写、面试以及如何找工作:主要为大家分析了学完课程之后,对自己如何定位?如何深入了解企业的招聘需求?如何将自己的技术背景补齐到与公司需求相match?如何编写简历?如何拥有属于自己的独一无二的大数据项目?如何掌握面试的关键技巧?目前大数据行业的薪资现状以及如何谈一个合适的薪资?
5. 具体的升级内容大纲,见“课程大纲”底部新增内容。
     这里需要提前特别提醒的是,新手如何看待Spark 1.x和Spark 2.x的关系,以及学习的建议。大家千万不要以为Spark 2.x完全颠覆了Spark 1.x,因此Spark 1.x的东西不用学了,那是完全错误的想法!事实恰恰相反,实际上Spark 2.x与Spark 1.x一脉相承,2.x完全是在1.x的基础上进行了功能的完善,底层引擎的优化,以及新的功能模块的增加。spark官方也发出了声明,spark 1.x的所有东西在未来都完全是有其价值和意义的,绝对不是被淘汰!
      因此对于新人来说,课程里讲解的Spark 1.x,不仅完全没有过时,而且在目前以及未来都是绝对有用的!实际上Spark 1.x只有极其少数的一些东西是被标记为淘汰的!因此,新人必须从本课程讲解的Spark 1.x开始,一点一点学习,循序渐进,千万不能急于求成!而且Spark 2.0还很不稳定,因此本次升级讲解的内容,主要是希望大家能够跟上技术的发展潮流,站在技术发展的前沿,而不是让大家马上学了spark 2.0后就开始投入生产环境使用!具体的分析,在课程里都有讲解,希望大家踏踏实实地学习。



超重磅免费升级通知!   

本次课程升级,总计132讲,60课时左右,内容扩充近一倍。将从入门到精通的各个阶段都进行了阶段升级。主要内容概述如下:
1、Scala编程进阶:讲解Scala高级编程技巧。
2、Spark核心编程进阶:本版本展示细致的Spark核心编程讲解,包括standalone集群操作以及spark-submit所有细节,补充大量实验,并补充讲解几乎所有的算子操作,并增添大量实战案例以及移动端app访问流量日志分析综合案例。
3、Spark内核原理进阶:全网独家讲解Spark常用的10个算子的内部原理。
4、Spark SQL实战开发:讲解Thrift JDBC/ODBC Server等高级内容,并增添新闻网站关键指标离线统计综合案例。
5、Spark Streaming实战开发:讲解Flume数据源等高级内容,并增添新闻网站关键指标实时统计综合案例。
6、Spark运维管理进阶:完全实战讲解与演练Spark的运维与管理的各种高阶技术,包括基于ZooKeeper和文件系统实现HA以及主从切换、多种作业监控方式,以及全网独家的Spark动态资源分配技术和Fair Scheduler技术。













回复

使用道具 举报

精彩评论1

admin 发表于 2018-1-29 09:02:09 来自手机 | 显示全部楼层
这套课很有帮助,我已经学会并入职了中国500强
blog-sidebar-img-1.jpg
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注0

粉丝0

帖子3

发布主题
关注我们
学链就是教育区块链

客服电话:021-31265335

客服邮箱:1250070011@qq.com

高校代理咨询:1250070011

周一至周五 9:00-18:00

学链就是教育区块链 - 致力于优质教育的普及与公平( 沪ICP备18023937号-1 沪公网安备31011802002859号 )

本站系统及云解决方案由 Tencent腾讯提供 © 2001-2018 StudyLink Inc.