[머신러닝] 2. 머신러닝 시스템의 종류 - 3

두비니

·

2020. 3. 3. 18:17

이 글은 '핸즈온 머신러닝' 책에

기반하여 작성되었습니다.

 

 

 

2. 머신러닝 시스템의 종류 - 3

 

 


 

 

머신러닝 시스템의 종류는 크게 세가지 범주로 나누어 생각합니다.

 

-사람이 지도하는가 (지도학습, 비지도학습, 준지도학습, 강화 학습)

-실시간으로 학습을 하고있는가 (온라인학습, 배치학습)

-실제 사례 기반인지 예측하는것인지 (사례기반학습, 모델기반학습)

 

 

오늘은 마지막 이야기! 이거만 하면 드디어 끝입니다ㅎㅎ

 

 

 

2.3) 사례 기반 학습과 모델 기반 학습

 

 

머신러닝 시스템이 하는 일은 결국 '예측'을 하는 것입니다.

예측을 잘 하기 위해서는, 일반화를 잘 해야합니다.

즉 한정된 데이터만 가지고도 새로운 데이터에도 해당되는 알고리즘을 생성할 줄 알아야 한다는 것입니다.

 

 

이러한 일반화를 위한 방법은 총 두가지, 사례 기반 학습모델 기반 학습이 있습니다.

 

 

 

 

2.3.1) 사례 기반 학습

 

 

말 그대로의 방법입니다. 스팸필터를 다시 예로 든다면 사용자가 스팸이라고 지정한 메일과 동일한 내용의 모든 메일을 스팸으로 분류합니다.

최악은 아니지만, 최선이라고 할 수도 없겠죠. (실제로 머신러닝에서는 당연히 이러한 방법은 사용하지 않습니다)

 

실제로는 두 메일 사이의 유사도를 측정합니다.

중복되는 단어가 많을수록 스팸으로 분류하는식이죠.

이렇게 유사도 측정을 이용해 새로운 데이터에 일반화 하는 것을 사례 기반학습이라고 합니다.

 

 

사례 기반학습

 

 

 

2.3.2) 모델 기반학습

 

 

 

 

모델 기반학습은 사례 기반학습과 반대로 샘플을 나누는 모델을 먼저 설정한 후,

새로운 샘플이 어디 속하는지 판단하는 방법입니다.

 

 

물론 모델을 멋대로 짜면 안되기때문에 기존 데이터셋과 비교하여 최대한 오차를 줄인 후, 진행하겠죠.