Apache Spark 社區作為全球最大的開源社區,也是Apache基金會旗下最流行的開源分佈式內存式大數據處理引擎。他快速、易於使用的框架,允許你解決各種複雜的數據問題,無論是半結構化、結構化、流式,或機器學習、數據科學。即使擁有來自250多個組織的超過1000個貢獻者,以及遍佈全球570多個地方的超過30萬個Spark Meetup社區成員,作為一名國內的Spark小白,我相信大家都有一個共同的痛點,就是國內Spark
相關資料過少。為此我們籌辦了一系列針對國內Spark開發者的活動,指路回顧 | SPARK + AI SUMMIT 2020 中文精華版線上峰會圓滿結束(附PPT下載)
作為普惠Spark中華小當家系列活動的第二站,我們隆重推出第一期Spark學習訓練營。由Spark 中文社區聯合阿里雲開發者社區聯合打造,持續定期更新。第一期訓練營邀請到了全 Apache Spark contributer 陣容,經過半個月對課程的精心打磨今天正式上線!限時免費搶報,速速來看→
訓練營時間
2020年7月20日-25日
開營名額
1500人,報滿即止
報名截止時間
2020年7月19日18:00
報名要求
希望你有一定的開發基礎,對 Spark感興趣想進一步深入瞭解
https://developer.aliyun.com/topic/trainingcamp/spark01
5天訓練營你將收穫
實戰視角下對 Spark 底層架構、核心功能模塊、社區生態等全方位解析,幫你建立對 Spark 應用場景與功能實現的系統認知。社區大佬們手把手實操演示,“家教”級輔導,社群答疑。 收穫Spark 生產環境開發的基礎技能,完成理論到實操的跨越,全程免費學 每天打卡成功,還能意外收穫老師的“加餐”課程,還可以免費獲得大禮包:包括 Spark summit 中文材料、電子書、實戰精選案例等。 豐富多樣的社區周邊免費送,並有機會成為訓練營志願者,獲得更多訓練營直通車,堅持 5 天學習打卡還會獲得Spark 定製馬克杯哦~
注:具體內容以報名頁面信息為準
5天訓練營課程表
DAY1第 1 講:Apache Spark入門
簡要介紹Apache Spark架構、DataFrames API等,涵蓋Apache Spark框架的基本原理。
主講嘉賓 周康,阿里巴巴技術專家, Apache Spark/Hadoop/Parquet contributor
DAY2 第2講 Spark SQL 介紹與實戰
主要介紹Spark SQL的基本架構,主要模塊和重要特性,常見的SQL性能問題與優化手段。
主講嘉賓 李呈祥,阿里巴巴高級技術專家,Apache Hive Committer, Apache Flink Committer
DAY3第 3 講:Spark for ETL and Data Science
主要介紹如何用Spark來做ETL以及交互式數據分析的最佳實踐,
主講嘉賓 章劍鋒,阿里巴巴高級技術專家, Apache Tez、Livy 、Zeppelin PMC ,Apache Pig Committer
DAY4 第4講 Using Delta lake
介紹Delta Lake的用戶場景,如何創建、追加和更新數據到數據湖,如何使用 Delta Lake 構建一個數據分析管道等內容。
主講嘉賓 辛現銀,阿里巴巴技術專家。
DAY5 第5講 Spark tuning and Best Practices
學生將在本節課中進行實操練習。
主講嘉賓 王宇,阿里巴巴達摩院高級算法專家
點擊頁面報名。報名截止日期:7月19日18:00
無論你是在校同學還在一線開發,我們期望永遠保持好奇、保持天真、擁有學習的熱情和活力。歡迎更多的開發者和Spark愛好者加入到Spark訓練營中共同成長。
報名鏈接:
https://developer.aliyun.com/topic/trainingcamp/spark01