잡학사전/머신러닝

[머신러닝] 얀센의 부등식(Jansen's inequality)

슬기나무 2022. 5. 25. 22:55
반응형

이번 포스팅에서는 얀센의 부등식에 대해 알아보겠습니다.

(출처: 선형대수와 통계학으로 배우는 머신러닝 with 파이썬, 장철원 지음)

 

 얀센의 부등식(Jansen's inequality)

얀센의 부등식은 기댓값의 convex 함수와 convex 함수의 기댓값 사이에 성립하는 부등식입니다.

 

얀센의 부등식은 아래와 같이 나타냅니다.

 

f(wx1+(1w)x2)wf(x1)+(1w)f(x2)f(wx1+(1w)x2)wf(x1)+(1w)f(x2)

 

앞서 언급했던 함수 ff가 컨벡스(convex)할 조건과 같습니다.

 

이를 좀 더 일반화한다면 아래와 같이 나타낼 수 있습니다.

 

f(w1x1+...+wkxk)w1f(x1)+...+wkf(xk)f(w1x1+...+wkxk)w1f(x1)+...+wkf(xk)

 

여기서 x1,...xkx1,...xk는 함수 ff의 정의역이며, w1,...wk0w1,...wk0이고 w1+...+wk=1w1+...+wk=1 입니다.

 

이 때, 위 부등식을 기댓값(EE)를 사용해 나타내면 아래와 같습니다.

 

f(E(X))E(f(X))f(E(X))E(f(X))

 

이를 얀센의 부등식이라고 합니다.

 

 

만약 두 점 x1,x2x1,x2에 대하여 고려한다면 어떻게 쓸 수 있을까요?

 

기댓값과 함수값의 평균을 취한 후 나타내면 아래와 같이 쓸 수 있습니다.

 

f(x1+x22)f(x1)+f(x2)2f(x1+x22)f(x1)+f(x2)2

 

즉, 아래로 볼록한 convex 함수라면 함수값을 먼저 구하고 평균을 한 것이 평균의 함수값보다 항상 큽니다.

 

만약 위로 볼록하다면 부등식의 방향은 반대가 됩니다.

 

 

여기까지 얀센의 부등식에 대해 알아보았습니다.

반응형