본문 바로가기
Data Analysis/ML

[ML] 지도학습과 비지도학습

by dataYANG 2022. 11. 8.
728x90

지도학습, 비지도학습

 

머신러닝(Machine Learning)은 일반적으로 데이터를 기반으로 패턴을 학습하고 그 결과를 예측하는 알고리즘 기법입니다.

 일반적으로 머신러닝은 3가지로 나뉩니다.

1. 지도학습(Supervised Learning)

2. 비지도학습(Unsupervised Learning)

3. 강화학습(Reinforcement Learning)

그럼 이제 차례대로 자세히 알아보겠습니다.

 

1. 지도학습(Supervised Learning)

지도학습은 명시적인 답이 있는 데이터가 주어진 상태에서 학습하는 러닝머신 방식입니다.

지도학습은 크게 분류와 회귀로 나뉩니다. 

간단히 설명하자면, 분류는 학습 데이터로 주어진 데이터의 피처와 레이블값을 머신러닝 알고리즘으로 학습해 모델을 생성하고, 이렇게 생성된 모델에 새로운 값이 주어지면 그 알고리즘을 통해 predict 값을 구하는 것입니다. 회귀는 통계학을 배우면 누구나 다 배우는 중요한 개념이며, 회귀는 여러 개의 독립변수(X)와 하나의 종속변수(Y)의 상관관계를 모델링하는 기법이라고 할 수 있습니다.

분류 예시) 강아지와 고양이의 사진을 분류하는 문제가 있습니다. 먼저 학습을 시키기 위해서 많은 강아지와 고양이의 사진이 필요합니다. 강아지와 고양이가 어떤 레이블에 속하는지 패턴을 알고리즘으로 인지한 뒤에 새로운 데이터가 들어왔을 때 이 데이터에 대한 레이블을 다시 강아지인지 고양이인지 판별하는 것입니다.

회귀 예시) 1 @ 4 -> 9, 5 @ 4 -> 29, 8 @ 9 -> 89라는 데이터(X1 @ X2 -> Y)가 있다면 어떠한 패턴을 알고리즘으로 인지한 뒤에 새로운 데이터(X1, X2)가 들어왔을 때 새 predict 값(Y*)을 도출하는 것입니다.

분류와 회귀의 가장 큰 차이점은 분류는 예측값이 이산형 자료, 회귀는 연속형 자료

 

지도학습의 종류는

  • 분류
  • 회귀
  • 시각/음성 감지/인지
  • 텍스트분석, 자연어처리(NLP)
  • 추천 시스템

 

 

2. 비지도학습(Unsupervised Learning)

비지도학습은 지도학습과 달리 정답이 없는 데이터를 비슷한 특징끼리 군집화 하는 것입니다.

비지도학습의 종류는

  • 클러스터링
  • 차원축소

 

군집화 예시
군집화 예시 : 3개의 군집으로 군집화

 

 

3. 강화학습(Reinforcement Learning)

강화학습은 지도학습과 비지도학습과 다른 종류의 알고리즘입니다.

강화학습은 에이전트가 주어진 환경에 대해 어떤 행동을 취하고 이로부터 보상을 얻으면서 학습합니다. 강화학습은 동적인 상태에서 데이터를 수집하는 과정까지 포함된 알고리즘입니다.

 

 

 

 

728x90

'Data Analysis > ML' 카테고리의 다른 글

[ML] 불균형 데이터 (Imbalanced Data)  (2) 2022.11.30

댓글