regression
-
[기계학습] 로지스틱 회귀(분류 Classification)(Logistic Regression) (Part 1/2)코딩(Coding)/기계학습 2022. 1. 21. 11:29
로지스틱 회귀(분류) 앞서 포스팅했던 선형회귀는 학습한 데이터를 기반으로 새로운 데이터에 대한 Output을 예측하는 문제라고 설명할 수 있겠다. 하지만, 로지스틱 회귀는 반대로 좌표평면상의 데이터를 각 그룹(class)으로 분류(classification)하는 것이다. 다음과 같은 데이터에 대해서 선형회귀를 적용한다고 가정한다면, 위 그림처럼 직선이 그려질 것이다. 이 직선을 토대로 x가 5를 기준으로 성공/실패를 분류 할 수 있을 것이다. 하지만, 문제는 아래에서 발생한다. 만약 새로운 데이터 (20, 성공)이 있다면, x가 10을 기준으로 성공/실패를 분류할 것인데, 예외로 (9, 성공)이 분류에 실패하게 될 것이다. 따라서 해결방법으로 새로운 함수를 도입한다. 바로 시그모이드(Sigmoid) 함수..
-
[기계학습] 선형회귀(Linear Regression) (Part 1/2)코딩(Coding)/기계학습 2022. 1. 11. 18:44
선형회귀 선형회귀는 머신러닝 뿐만 아니라 딥러닝까지의 개념을 모두 관통하는 가장 기초적인 개념이다. 이제 부터 하나씩 천천히 내용을 살펴보자 가정 아래 그림처럼 임의 점들이 좌표계에 찍혀있다고 하자 우리의 목표는 해당 좌표들을 가장 잘 대변하는 직선의 방정식을 찾는 것이다. 가설 정의 우리는 주어진 점들을 가장 잘 표현하는 가설직선(H(x))를 정의하는 것이다. 가설 직선 H(x)는 아래와 같이 표현 할 수 있겠다.** H(x)=Wx+b 직선의 모양은 기울기(W)와 절편(b)로 결정되기때문에 우리가 결국에 구해야하는 것은 W와 b이다. 오차(Cost, Loss, Error) 우리가 정의한 가설직선의 오차를 구해보자 간단한 아이디어로 가설직선의 값(H(x))과 실제 점(Y)의 차이를 구하..