잡학사전/머신러닝

[머신러닝] 초평면(hyperplane)과 반공간(halfspace)

슬기나무 2022. 3. 20. 22:16
반응형

이번 포스팅에서는 초평면(hyperplane)과 반공간(halfspace)에 대해 알아보겠습니다.

 

참고문헌: 선형대수와 통계학으로 배우는 머신러닝 with 파이썬, 장철원 지음

 

 

 초평면(hyperplane)

초평면은 아래와 같이 $w^Tx=b$를 만족하는 데이터 포인트 $x$의 집합을 말합니다.

 

$$ \left\{x\mid w^Tx=b\right\} $$

 

이 때 $w$는 $n$ 차원 가중치 벡터 , $b$는 스칼라 값입니다.

 

여기서 내적값이 $b$가 아니라 0인 형태로 바꿉니다.

 

$$ \left\{x\mid w^T\left(x-x_0\right)=0\right\} $$

 

이 때 $x_0$는 초평면 내 어떤 점이든 괜찮습니다.

 

초평면의 개념

두 벡터의 내적값이 0이면 서로 수직이므로,

 

이를 그림으로 나타내면 위와 같습니다.

 

이 공간은 초평면(hyperplane)에 의해 두개의 반공간(halfspace)으로 나뉩니다.

 

반공간은 아래와 같은 형태로 나타냅니다.

 

$$\left\{w^Tx \leq b\right\}$$

 

반공간(halfspace)

위 그림은 반공간을 나타낸 그림입니다.

 

$w^Tx=b$라는 경계가 존재하기 때문에

 

초평면에 의해 나뉜 반공간은 컨벡스 셋입니다. 

 

 

개념만 익히니 살짝 와닿지가 않는 느낌입니다.

 

나중에 어떻게 써먹게 될지 궁금합니다.

 

여기까지 초평면과 반공간에 대해 알아보았습니다.

 

 

반응형