머신러닝

[머신러닝] 분류 알고리즘 한 페이지 정리(로지스틱회귀, SVM, KNN, 결정트리, 앙상블)

데이터요리사 2021. 11. 30. 09:36

 

구분 로지스틱회귀 SVM KNN 결정트리 앙상블
정의 독립 변수의 선형 결합을 이용하여 개별 관측치가 어느 집단에 속하는지 확률을 계산하여 분류 데이터들을 가능한 멀리 두 개의 집단으로 분리시키는 최적의 초평면 기반 분류 새로 입력된 데이터를 거리기반으로 클래스를 설정하여 분류 의사결정규칙을 도표화하여 관심대상이 되는 그룹을 몇 개의 소그룹으로 분류 여러 개의 분류기를 결합하여 성능 개선






주요 개념
- 선형분리
-마진최대화
-커널(데이터 차원수 늘림. 선형커널, RBF커널)
-초평면, 서포트벡터, 마진
-하이퍼파라미터(k)값을 어떻게 설정하느냐가 성능을 좌우
-유클리드거리
- 해석이 쉬움
- 배치학습만 가능
- 학습과정 병렬화 가능
- 랜덤포레스트
- 배깅, 부스팅

 

728x90