1. 머신러닝의 개념

머신러닝 이전에는 개발자가 컴퓨터에게 일일이 모든 case에 대한 행동 양식을 지정해주었다. 따라서 개발자가 지정하지 않은 case나 복잡한 상황에서는 컴퓨터를 제어하기가 어렵다는 한계가 있었다. 이러한 한계를 극복하고자 등장한 것이 머신러닝이다. 머신러닝은 컴퓨터가 데이터나 상황을 학습하여 스스로 의사결정할 수 있도록 하는 기법이다. 머신러닝의 등장으로 일일이 case에 대해 행동 양식을 지정해줄 필요가 없어졌고, 컴퓨터로 더욱 더 복잡한 일들을 할 수 있게 되었다.



2. 머신러닝의 종류

2-1) 지도학습

이미 레이블링 된 데이터에서 규칙을 찾아 학습하는 기법이다. 데이터와 레이블 값과의 관계를 파악하여 관계식을 도출해낸다. 크게 회귀와 분류로 나누어진다.

  • 회귀

    예측하고자 하는 predict 값이 실수형 자료일 때, 이를 회귀(regression)라고 한다.
    ex) 아파트 평수에 따른 집값 예측

  • 분류

    예측하고자 하는 predict 값이 범주형 자료일 때, 이를 분류(classification)라고 한다.
    ex) 학습 시간에 따른 학점(A~F) 예측


2-2) 비지도학습

사전 데이터 없이 컴퓨터가 스스로 레이블을 만들어낸다. 가령, 고양이와 개 사진을 컴퓨터에게 보여주고 이것을 분류하게 하는 것이 비지도 학습이라고 할 수 있다. 대표적으로 군집화, 이상치 탐지 등이 있다.

댓글남기기