머신러닝을 위한 가장 중요한 데이터 전처리 기법 중 하나가 바로 Dimensionality Reduction 입니다. 고차원의 데이터를 차원축소 없이 바로 training에 사용하면, 그에 따른 부작용이 상당하기 때문입니다. 앞으로의 글에서 이 Dimensionality Reduction에 대해 아래와 같이 총 4부에 걸쳐 다뤄보려고 합니다. - 1 : Curse of Dimensionality - 2 : Principal Component Analysis (PCA) - 3 : Linear Discriminant Analysis (LDA) - 4 : Kernel Principal Component Analysis (KPCA) Abstract 이 글에서는 model training에 사용되는 데이터의 차원..