이번 포스팅에서는 오버피팅(Overfitting)과 언더피팅(underfitting)에 대해 알아보겠습니다. (출처: 선형대수와 통계학으로 배우는 머신러닝 with 파이썬, 장철원 지음) 오버피팅(Overfitting)과 언더피팅(underfitting) 머신러닝 모형이 실제 모형에 얼마나 가깝게 모델링되었는지와 관계된 용어인 오버피팅과 언더피팅은 각각 특정 data set에 과도하게/과소하게 적합된 것을 말합니다. 실제 데이터 모형이 $n$ 차원식이라고 했을 때 수식으로 나타내면 아래와 같습니다. $$ y_i = w_nx^n+w_{n-1}x^{n-1}+...+w_1x+w_0$$ 오버피팅은 특정 데이터셋에 과도하게 적합된 것을 말하며, 식으로 나타내면 아래와 같습니다. $$y_i = w_{n+m}x^{n..