CS/머신러닝

[머신러닝] 머신러닝이란 무엇일까? [컴공과고씨]

시간빌게이츠 2022. 7. 2. 18:17
반응형

요즘 핫한 머신러닝에 대해서 쭉 공부를 할 것인데 먼저 머신러닝이 무엇인지에 대해서 간단히 알아보도록 하겠습니다.

 

1. 머신러닝이란?

먼저 머신러닝을 간단한 도식으로 표현해 본다면 바로

이러한 그림이 될 것입니다.

 

자 이 그림이 의미하는 바는 무엇이냐?

 

예를 들어서 포탄을 날린다고 하면 이 때 포탄의 도착지점을 결정하는 지점의 요인에는 날리는 세기, 바람의 방향, 포탄의 크기, 각도 등이 있을 것입니다. 자 이것을 input이고 우리는 수학적 이론에 따라 계산을 하면 도착 지점이 나오겠죠.

 

이때 black box는 수학적 모델이 될 것입니다. 그런데 만약 우리가 수학적 공식을 모른다면?

직접 포탄을 쏘면 output을 알 수 있겠죠? 그럼 바람의 세기, 각도 등을 무수하게 바꾸면서 포탄을 쏘면 각각 다른 무수한 output이 나오게 될 것입니다. 그러면 이 무수한 input과 output을 이용해서 black box를 구하는 것이 바로 머신러닝입니다.

 

즉, 무수한 데이터(input)과 output을 가지고 스스로 내부 function을 알아내는 것이죠. 이것이 바로 기본적인 기계학습(머신러닝)의 개념입니다.

 

2. 머신러닝의 대표 유형

머신러닝에 대표유형에 대해서 살펴보겠습니다. 

2가지 대표 유형을 볼 것인데 하나는 Supervised Learning(지도 학습)이고 다른 하나는 Unsupervised Learning(비지도 학습)이 있습니다.

 

일단 지도 학습은 학습 데이터에 대해서 정답이 있습니다. 예를 들어 사진이 막 있는데 어떤 것은 개이고 어떤 것은 고양이인 것입니다. 학습을 시킬 때 사진을 주면서 이것은 개야 이것은 고양이이야 라고 말이죠. 또한 Regression 문제가 있습니다. 이건 앞서 말했듯 분류를 하는게 아니라 대포 계산과 같이 각 input 마다 각각의 정답 값을 가지고 있는 문제도 지도 학습에 해당이 됩니다. 정답을 알고 있기 때문에 우리가 input을 주었을 때 예측 값과 정답 값을 비교하여 피드백이 가능합니다.

 

반대로 비지도 학습은 정답이 뭔지는 모르지만 둘은 다르기 때문에 비슷한 것 끼리 묶어주는 것입니다. 이것을 군집화 clustering이라고 합니다.

 

여기서 이제 정답이라는 것은 output을 말하는 것이죠. 

 

또 다른 유형은 준지도 학습, 강화 학습 등이 준지도 학습은 나중 딥러닝 때 자세히 배워보도록 하겠습니다.

 

퀴즈

1. 이메일이 스펨인지 아닌지 학습하는 필터

2. 웹 뉴스 중 관련된 스토리끼리 그룹화 하는 것

3. 손님의 데이터를 가지고 비슷한 유형의 소비를 하는 사람끼리 묶는 것

4. 환자들의 데이터를 가지고 당뇨인지 아닌지 판단하는 것

 

정답

1. 지도 학습

2. 비지도 학습

3. 비지도 학습

4. 지도 학습

 

 

 

 

반응형