Spark 이론 및 설치

Spark 이론

Spark Standalone Cluster


데이터 처리 방법

PySpark RDD → 요즘은 거의 사용 X

PySpark - DataFrame, SQL

PySpark - Datasources, Built-In Functions


머신러닝

PySpark - MLlib

PySpark - Streaming