머신러닝 4

머신러닝 분류 모델의 평가 지표 - 정확도, 정밀도, 재현율, 민감도, F1 스코어

1. 머신러닝 모델의 '평가' - 학습이 완료된 모델이 예측한 값과 실제값이 얼마나 일치하는지를 계산하여 모델의 성능을 판단. - 이 때 사용하는 데이터는 학습 이전에 미리 분할해 두었던 테스트 셋임. - 머신러닝의 기법(분류 모델이냐? 회귀 모델이냐? 군집 모델이냐?)에 따라 평가 지표는 달라짐. 2. 분류 모델의 평가 방법 - 분류 모델의 성능을 평가하기 위한 가장 기본적인 방법은 정확도(Accuracy)임. - 정확도 이외에 재현율, 정밀도, F1 점수 등이 있고, 데이터와 모델이 어디에 사용되느냐에 따라 성능 지표를 제대로 설정해야함. - 무작정 정확도가 높다고 좋은 모델이 아님. - 각 성능 지표를 이해하기 위해서 가장 기본이 되는 혼동행렬에 대한 이해가 필요함. 3. 혼동행렬(Confusion..

머신러닝 2023.07.14

[머신러닝] 분류 알고리즘 한 페이지 정리(로지스틱회귀, SVM, KNN, 결정트리, 앙상블)

구분 로지스틱회귀 SVM KNN 결정트리 앙상블 정의 독립 변수의 선형 결합을 이용하여 개별 관측치가 어느 집단에 속하는지 확률을 계산하여 분류 데이터들을 가능한 멀리 두 개의 집단으로 분리시키는 최적의 초평면 기반 분류 새로 입력된 데이터를 거리기반으로 클래스를 설정하여 분류 의사결정규칙을 도표화하여 관심대상이 되는 그룹을 몇 개의 소그룹으로 분류 여러 개의 분류기를 결합하여 성능 개선 개 념 도 주요 개념 - 선형분리 -마진최대화 -커널(데이터 차원수 늘림. 선형커널, RBF커널) -초평면, 서포트벡터, 마진 -하이퍼파라미터(k)값을 어떻게 설정하느냐가 성능을 좌우 -유클리드거리 - 해석이 쉬움 - 배치학습만 가능 - 학습과정 병렬화 가능 - 랜덤포레스트 - 배깅, 부스팅

머신러닝 2021.11.30

[머신러닝] - 문제 정의하기, 지도학습, 비지도학습이란?

안녕하세요. 데이터 요리사, 루나입니다. 어떤 일이든지 내가 해결하고자 하는 것이 무엇인지 분명하게 정의하는 것이 매우 중요합니다. 머신러닝 문제를 정의하기 위해서는 기계가 학습하는 방법에 대해서 알고 있어야합니다. 기계는 어떤 식으로 학습을 할까요? 1 머신러닝 학습방법 기계가 학습하는 방법을 보통 세 가지로 분류합니다. 지도학습, 비지도학습, 강화학습 이렇게요. 여기서 '지도'는 map이 아닌 teach의 개념입니다. 기계에게 답을 가르쳐주느냐, 주지 않느냐에 따라서 크게 지도/비지도 학습으로 나누고 이 둘을 적당히 섞은 준지도학습(Semi-supervised Learning)이라는 개념도 있습니다. 각각의 학습 방법에 대해서 살펴보겠습니다. 1-1. 지도학습(Supervised Learning) 아..

머신러닝 2021.01.26

머신러닝이란? - 머신러닝 절차, 머신러닝 프로세스 이해하기

안녕하세요. 데이터 요리사, 루나입니다. 1 머신러닝이란? 머신러닝(Machine Learning)은 말 그대로 기계(Machine)가 학습(Learning)을 하는 것입니다. 사람이 책을 읽고 문제집을 풀어가면서 이론을 익혀나가듯이, 기계는 수많은 데이터를 읽어들여서 그 안에 숨겨진 패턴을 찾고, 문제를 해결할 수 있는 알고리즘을 찾아나갑니다. 이렇게 주어진 데이터를 분석해서 문제해결 솔루션을 만들어내는 과정을 기계학습, 즉 머신러닝이라고 합니다. 기존에 프로그래밍을 작성해본 경험이 있는 사람이라면, 위의 그림이 쉽게 이해가 될 것입니다. 프로그래머가 작성하던 코드를 머신러닝이나 딥러닝에서는 기계가 스스로 찾아냅니다. 프로그래머의 역할이 바뀌게 되는거죠. 머신러닝을 개발하는 개발자는 기계가 스스로 학습..

머신러닝 2020.10.19
LIST