용어 사전 math 용어 페이지
주성분 분석
중요한 분산 방향을 찾는 차원축소 방법
핵심 아이디어
주성분 분석은 데이터가 가장 크게 퍼지는 방향을 찾아 그 축으로 데이터를 다시 표현하는 차원축소 방법입니다. 보통 중심화한 데이터의 공분산 행렬을 만들고, 그 고유벡터를 주성분 축으로 사용합니다.
큰 고유값에 대응하는 방향일수록 데이터 분산이 크기 때문에 더 중요한 축으로 해석합니다. 그래서 PCA는 데이터를 덜 중요한 방향으로부터 압축하는 대표적인 방법으로 쓰입니다.
이 블로그에서의 역할
Mathbong에서는 PCA를 고유값, 고유벡터, 그리고 특이값 분해가 실제 데이터 분석과 차원축소에 어떻게 이어지는지 보여 주는 대표 응용으로 소개합니다.