목록회귀 (2)
개발하는 뚱이

규제란??모델이 과적합이 일어나지 않게 가중치를 제한하여 과적합을 완화하는 방법 과적합(Overfitting) 과적합이란 모델이 학습 데이터에 너무 맞춰서 학습한 상태를 말합니다.이때 학습 데이터에서는 성능이 뛰어나지만 새로운 데이터에 대해서 성능이 떨어지는 문제가 생기는 것을 말합니다. 다중 회귀를 하다 보면 독립변수(특성)의 개수가 엄청 많은 경우가 있는데, 이럴 때 모델은 특성들 간의 관계를 학습하기 어려워지고, 유의미한 데이터(노이즈)를 학습하면서 과적합 문제가 발생 합니다.이제 이러한 문제를 해결하기 위한 방법을 알아봅시다. 릿지 & 라쏘 회귀는 선형회귀의 한 종류입니다.선형 회귀에서 독립 변수의 개수에 따라 단순회귀와 다중 회귀로 나뉩니다.단순 회귀 : 독립 변수(특성) = 1다중 회귀 :..

회귀란 무엇일까?? - 통계학에서 회귀란 여러 개의 독립 변수와 한 개의 종속 변수 간의 상관관계를 모델링하는 기법을 통칭합니다. 예를 들어 집값을 예측하는 모델에서 집의 크기, 방의 개수, 화장실 개수 등등은 독립 변수라 할 수 있고 집값은 종속 변수라고 할 수 있습니다. 이제 이러한 관계가 어떠한 식으로 나타나는지 모델링하고 예측하는 방법입니다. 모델링이란 : 주어진 데이터를 수학적 표현(모델)으로 변환하고, 이를 통해 예측 또는 분석을 할 수 있는 구조를 만드는 과정 쉽게 정리 하자면 두 변수 사이의 상관관계를 분석하는 방법이라고 생각하면 쉽습니다. 그렇다면 이제 회귀 방법 중에서도 가장 기본적인 형태인 선형 회귀에 대해 설명을 해보겠습니다. 선형 회귀란??선형 회귀는 어떠한 독립 변수..