Contents

KNN과 SVM에 대하여

   Jul 27, 2024     1 min read

KNN과 SVM에 대하여 알아본 글입니다.

안녕하세요!

오늘은 KNN과 SVM에 대하여 알아보겠습니다.

K-최근접 이웃 (K-Nearest Neighbors, KNN)

K-최근접 이웃(KNN)은 분류 및 회귀 문제에 사용되는 지도 학습 알고리즘 중 하나입니다. 아래에서 KNN에 대해 설명하겠습니다.

동작 원리

  • 이웃의 선택: 새로운 데이터 포인트와 가장 가까운 K개의 이웃을 선택합니다.
  • 다수결 투표: 분류 문제의 경우 K개의 이웃 중 다수결 투표를 통해 새로운 데이터 포인트의 클래스를 결정합니다. 회귀 문제의 경우 K개의 이웃의 평균을 예측값으로 사용합니다.

장단점

  • 장점: 구현이 간단하며, 훈련 단계가 빠르고 직관적입니다.
  • 단점: 예측 단계에서 모든 훈련 데이터와의 거리를 계산해야 하므로 계산 비용이 높을 수 있습니다.

활용

  • 이상치 탐지: 이상치 탐지에 사용될 수 있습니다.
  • 추천 시스템: 비슷한 사용자 또는 상품을 찾는 데 사용될 수 있습니다.

서포트 벡터 머신 (Support Vector Machine, SVM)

서포트 벡터 머신(SVM)은 분류 및 회귀 문제에 사용되는 지도 학습 알고리즘으로, 데이터를 고차원 공간으로 매핑하여 최적의 결정 경계를 찾는 데 사용됩니다.

동작 원리

  • 초평면(Decision Boundary) 찾기: 데이터를 분리하는 최적의 초평면을 찾습니다.
  • 서포트 벡터(Support Vector) 찾기: 초평면에 가장 가까이 있는 데이터 포인트인 서포트 벡터를 찾습니다.
  • 커널 기법(Kernel Trick): 비선형 문제를 해결하기 위해 커널 함수를 사용하여 데이터를 고차원 공간으로 매핑합니다.

장단점

  • 장점: 고차원 데이터에서 우수한 성능을 보이며, 커널 기법을 통해 비선형 문제를 해결할 수 있습니다.
  • 단점: 모델의 해석이 어려우며, 데이터 전처리와 매개변수 설정에 민감합니다.

활용

  • 이진 및 다중 클래스 분류: 분류 문제에 폭넓게 사용됩니다.
  • 이상치 탐지: 이상치 탐지에 사용될 수 있습니다.

마치며

KNN과 SVM은 각각의 특징에 따라 다양한 문제에 유용하게 활용되는 지도 학습 알고리즘입니다.

감사합니다!