MNIST 불러오기
이번 포스트에서는 고등학생과 미국 인구조사국 직원들이 쓴
70,000개의 작은 숫자 이미지를 모은 MNIST 데이터셋을 사용하겠습니다.
sklearn으로 MNIST를 불러오는 코드입니다.
이진 분류기 훈련
문제를 단순화해서 모든 숫자가 5인지 아닌지만 분류해보겠습니다.
이 분류기는 '5'와 '5 아님'의 두 가지 클래스를 구분할 수 있는
이진 분류기(binary classifier)의 한 예입니다.
성능 측정
분류기 평가는 회귀 모델보다 훨씬 어렵기 때문에 조금 길게 설명하도록 하겠습니다.
다중 분류
여태 다룬 이진 분류는 두 개의 클래스를 구별하는 반면
다중 분류기(또는 다항 분류기)는 둘 이상의 클래스를 구별할 수 있습니다.
에러 분석
다중 레이블 분류
여태는 각 샘플을 하나의 클래스에만 할당했는데,
샘플을 여러 클래스에 할당해야 할 경우도 있습니다.
이렇게 여러 개의 이진 꼬리표를 출력하는 분류 시스템을 다중 레이블 분류 시스템이라고 합니다.
다중 출력 분류
마지막으로 알아볼 것은 다중 출력 다중 클래스 분류(간단히 다중 출력 분류)입니다.
다중 레이블 분류에서 한 레이블이 다중 클래스가 될 수 있도록 일반화한 것입니다.
'DATA > 머신 러닝' 카테고리의 다른 글
[머신 러닝] 서포트 벡터 머신 (support vector machine) (0) | 2022.01.17 |
---|---|
[머신 러닝] 경사 하강법 (Gradient descent) (0) | 2022.01.16 |
[머신 러닝] 간단한 머신 러닝 프로젝트 해보기 (0) | 2022.01.11 |
[머신 러닝] 행렬 인수분해 (Matrix Factorization) (0) | 2022.01.10 |
[머신 러닝] 협업 필터링 (collaborative filtering) (0) | 2022.01.10 |