iT邦幫忙

0

從零開始的一日實戰 PySpark 生活!

大數據時代,絕對不能錯過的一日實戰工作坊
由老司機帶著你快速上手,肯定是你上手 Spark 的絕佳時機!

Spark 是處理大數據最熱門的框架之一,透過 PySpark 可以方便熟悉 Python 的資料科學家處理大量資料。 本堂課程將手把手實戰教學大數據分析,結合 Python 以及最新的 Spark 2.2 「從 0 開始掌握 Spark」

【課程大綱】

  1. 數據時代
  2. Spark 簡介
  3. RDD 原理
  4. 環境建置與介紹
  5. RDD 動手做
  6. SparkSQL 做資料處理
  7. 訓練一個 ML 模型吧

【講師】

Bryan Yang
活躍於資料工程學會,Spark Taiwan社群。
在行動數據產業擔任資深資料科學家,也曾任職於電信及顧問業,致力於Spark技術的推廣與應用。

【適合對象】

  • 需要對 Linux, Hadoop 及 Python 有基本認識。
  • 適合:數據分析師,數據科學家,對大數據分析有興趣的同學。

【注意事項】
場地提供電腦,如自備電腦,請事先準備以下環境:

  • Linux 或 Mac 系統(如果非 Linux 系統,需要事先安裝 Centos 7 的 vm )
  • 事先安裝 Docker
  • 至少 2 CPU + 8 G Ram + 20 G 硬碟空間

更多詳細介紹
立即報名


尚未有邦友留言

立即登入留言