-
[기계학습] 기계학습(Machine Learning) 기본 개념코딩(Coding)/기계학습 2022. 1. 10. 21:43728x90
Machine Learning
기계학습의 정의를 퍼셉트론과 연결지어 설명해야겠지만, 앞으로 2개의 포스팅(선형회귀, 분류 기본 기술)을 설명하기에 쉽게 "내가" 공부하면서 정의한 기계학습에 대해서 설명하려고 한다.
추후 포스팅은 선형회귀부터 CNN, RNN, Transformer까지 다룰 예정이다.기계학습이란
어떠한 데이터로부터 스스로 "학습"하여 작동하는 것이다.- 지도학습(Supervised Learning)
- Label(정답)이 정해져있는(알고 있는) 데이터로 부터 학습을 진행한다.
- Label을 보고 학습 -> Training Datasets
- 종류
- Predicting(예측)
- Classification(분류)
- 비지도 학습(Unsupervised Learning)
- 지도학습과 반대로 Label이 정해져있지 않는 데이터로부터 학습을 진행한다.
- 데이터 자체만 보고 학습을 진행한다.
- 종류
- clustering(군집화)
- Dimensionality reduction(차원 축소)
기존의 Rule-Based에서는 Data와 Rulu을 입력으로 넣으면 그에 해당하는 Output(결과)값을 내놓는 방식이였다면,
기계학습은 (대량의) Data와 Output(결과=Label)을 바탕으로 그 데이터와 Label사이 속에서 Rule을 찾아 스스로 학습한다.이게 과연 무슨 말인가? 납득될만한 예시를 준비해 보았다.
기존에는 삼각형의 넓이를 구하기 위해서는 삼각형의 넓이를 구하는 공식과 공식에 필요한 밑변과 높이(Data)가 필요했다. 입력 Data와 공식을 통해 Output을 구해낸 것이다.
하지만 기계학습은 삼각형의 넓이를 구하는 공식을 알지 못하여도, (많은 양의) 입력 Data(밑변, 높이)와 Output(삼각형의 넓이)값이 있다면 그 Data와 Output 사이에서 Rule(삼각형의 넓이 공식)을 스스로 찾아낸다.
비록 비유가 간단한 삼각형의 넓이공식으로 비유했지만, 이보다 훨씬 복잡한 문제에 대해서도 적용할 수 있다는 큰 장점이있다.
예를 들어 이미지에서 특정 물체 검출이라던지, 시험 데이터를 통해 다음 시험 성적 예측이라던지 등등 복잡한 문제도 데이터만 있다면, 기계학습을 통해 Rules을 찾아낼 수 있다.다음 포스팅에서는 기계학습과 딥러닝의 모든 기초가 되는 선형회귀를 살펴보고 Pytorch를 통해서 실습하는 포스팅을 다루고자 한다.
728x90'코딩(Coding) > 기계학습' 카테고리의 다른 글
[기계학습] IRIS 데이터를 분류하는 분류기를 만들어보자(코드 실습) (0) 2022.02.08 [기계학습] 로지스틱 회귀(분류 Classification)(Logistic Regression) (Part 2/2) (0) 2022.01.25 [기계학습] 로지스틱 회귀(분류 Classification)(Logistic Regression) (Part 1/2) (0) 2022.01.21 [기계학습] 선형회귀(Linear Regression) (Part 2/2) (0) 2022.01.18 [기계학습] 선형회귀(Linear Regression) (Part 1/2) (0) 2022.01.11 - 지도학습(Supervised Learning)