Spark 이론 및 설치
Spark 이론
Spark Standalone Cluster
데이터 처리 방법
PySpark RDD → 요즘은 거의 사용 X
PySpark - DataFrame, SQL
PySpark - Datasources, Built-In Functions
머신러닝
PySpark - MLlib
PySpark - Streaming