티스토리 뷰

머신 러닝이란?

인공지능 분야 중 하나로써, 컴퓨터에게 데이터를 학습시키고, 그를 바탕으로 예측, 분류와 같은 어떤 작업을 수행하도록 하는 것을 의미한다.


보다 Formal하게는, 다음과 같이 정의되기도 한다.

Tom Mitchell (1998) Well-posed Learning  Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. 


머신러닝의 예로는, 간단하게는 대부분의 메일 서비스에서 제공하는 스팸판단 기능을 들 수 있으며, 크게는 IBM의 프로젝트 중 하나인 슈퍼컴퓨터 Watson을 들 수 있다. Watson은 방대한 웹 데이터를 이용하여 지식을 학습하였으며 이를 바탕으로 퀴즈 쇼 제퍼디!에 출연하여 우승을 차지하기도 하였다.



머신 러닝의 종류

머신 러닝의 종류는 크게 supervised learning, unsupervised learning으로 나눌 수 있다.

supervised learning은 답을 가지고 있는 데이터를 이용하는 것이고, unsupervised learning은 답이 없는 데이터를 이용해 학습시키는 것이다.

예를 들어, 사용자에게 어떤 메일이 스팸인지 아닌지를 판단하게 하고, 그것을 이용해 스팸 분류기를 구현한다면 학습의 대상이 되는 메일은 모두 스팸/스팸아님 이라는 답(label)을 가지게 된다. 이를 이용한 학습을 supervised learning이라 한다.

unsupervised learning은 이와 반대로 답이 없는 것이며 clustering algorithm (모여 있는 데이터를 찾는 것) 과 같은 것이 unsupervised learning이다. 



참조

[1] Machine Learning by Andrew Ng, http://coursera.org

[2] Machine Learning - Wikipedia, http://goo.gl/fjw1

[2] 왓슨(컴퓨터) - 위키백과, http://goo.gl/fDwnQL

댓글