이번 포스팅에서는 아핀 셋(affine set)과 컨벡스 셋(convex set)에 대하여 알아보겠습니다.
저도 잘 모르는 분야라 이제부터 교재를 통해 공부해보려고 합니다..
본 포스팅은 아래의 출처를 참고하였습니다.
(출처: 선형대수와 통계학으로 배우는 머신러닝 with 파이썬, 장철원 지음)
직선과 선분
아핀 셋과 컨벡스 셋을 알아보기에 앞서 직선과 선분에 대해 먼저 알아보겠습니다.
직선(line)과 선분(line segment)는 비슷한 것 같지만 다릅니다.
직선은 시작과 끝 지점이 존재하지 않는 반면, 선분은 시작과 끝 지점이 존재합니다.
공간 에서 두 점 를 잇는 선을 아래와 같이 표현해보겠습니다.
위 식에서 만약 이면 가 되고, 이면 이 됩니다.
만약 이면 는 를 잇는 선분이 되고,
이면 직선이 됩니다.
아핀 셋(affine set)
2차원 공간에서 집합 내부의 두 점을 잇는 직선이 있다고 가정할 때
이면 집합 는 아핀 셋입니다.
아핀 셋은 시작과 끝 범위 제한이 없는 직선을 포함하므로,
아핀 셋 또한 범위 제한이 없습니다.

만약 2차원이 아니라 차원이라면 으로 쓸 수 있고,
이를 포인트 에 대한 아핀 조합(affine combination)이라고 합니다.
이 때, 을 만족합니다.
아핀 조합은 곧 집합 에 속하는 점들의 선형 결합(linear combination)과 같습니다.
아핀 함수와 선형 함수의 차이
차원에서 차원으로 차원을 변환하는 함수 이 존재한다고 해봅시다.
위 함수 의 의미는 차원 공간 에 속하는 벡터를
차원 공간 에 속하는 벡터로 변환한다는 의미입니다.
함수 가 선형 변환이라면 행렬로 나타낼 수 있고, 이를 라 하면
데이터 포인트 를 선형 변환하는 선형 함수는 위와 같은 식으로 나타낼 수 있습니다.
여기서 아핀 함수가 선형 함수와 다른 점 하나가 있는데요.
아핀 함수는 여기에 상수항 가 추가된다는 것입니다.

선형 변환을 통해 만들어진 선형 부분 공간은 원점을 지나지만,
아핀 변환을 통해 만들어진 아핀 부분 공간은 상수 에 의해
절편 를 지나는 것을 확인할 수 있습니다.
컨벡스 셋(convex set)
만약 집합 내부의 두 점 사이의 선분이 집합 에 속한다면
집합 는 컨벡스(convex)합니다.
즉, 두 점 에 대해 을 만족하는 에 대하여
아래 조건을 만족하면 집합 를 컨벡스 셋이라고 합니다.
눈치 채셨겠지만 컨벡스 셋은 두 점을 잇는 직선을 포함하는 아핀 셋과는 달리
두 점 사이의 선분을 포함합니다.

위 그림에서 왼쪽은 컨벡스 셋이지만 오른쪽은 컨벡스 셋이 아닙니다.
오른쪽 그림은 두 점 사이의 선분 내 점들이 모두 도형에 속하지 않기 때문입니다.
이 때, 아핀 셋은 두 지점 사이의 모든 선을 포함하므로
자연스럽게 두 점 사이의 모든 선분 또한 포함하기 때문에
아핀 셋이면 컨벡스 셋이라고 말할 수 있습니다.
그리고 데이터 포인트 이 존재할 때,
이를 의 컨벡스 조합(convex combination)이라고 합니다.
이 때, 이며, 을 만족해야 합니다.
그리고 컨벡스 헐(convex hull)이라는 개념이 있는데요.
컨벡스 셋이 집합 내부의 두 점 사이 선분을 통해 컨벡스 여부를 알아보았다면
컨벡스 헐은 주어진 점들을 포함하는 컨벡스 셋을 의미합니다.

여기까지 아핀 셋(affine set)과 컨벡스 셋(convex set)에 대하여 알아보았습니다.
'잡학사전 > 머신러닝' 카테고리의 다른 글
[머신러닝] 그리드 서치(grid search) (0) | 2022.04.12 |
---|---|
[머신러닝] 파이프라인(Pipeline) (0) | 2022.04.11 |
[머신러닝] 교차 검증(cross validation) (0) | 2022.04.05 |
[머신러닝] 오버피팅과 언더피팅 (0) | 2022.04.04 |
[머신러닝] 초평면(hyperplane)과 반공간(halfspace) (0) | 2022.03.20 |