clear_uncertainty

네이버 부스트캠프 모각공 캠페인 1일차 - 벡터가 뭐예요? 본문

네이버 부스트캠프 - AI Tech 3rd/핵심만 담은 AI 수학 지식

네이버 부스트캠프 모각공 캠페인 1일차 - 벡터가 뭐예요?

SOidentitiy 2021. 11. 8. 15:49
728x90

모든 설명 및 자료의 출처는 네이버 부스트코스의 <[부스트캠프  AI Tech 3기] Pre-Course>입니다.

(https://www.boostcourse.org/onlyboostcampaitech3/joinLectures/329424)

 

<핵심만 담은 AI를 위한 수학 지식>

백터가 뭐예요?

벡터는 숫자를 원소로 가지는 리스트 또는 배열입니다.

왼쪽처럼 세로로 나열되있으면 열벡터, 오른쪽처럼 가로로 나열되있으면 행벡터라고 부릅니다.

기본적으로 인공지능에서 다루는 벡터는 위의 두가지 형태이고, 이를 코드로 나타내면 numpy의 array를 이용합니다.

벡터에 있는 벡터의 개수를 벡터의 차원이라 말합니다.

 

벡터는 공간에서 한 점을 나타냅니다.

벡터는 원점으로부터 상대적 위치를 표현합니다.

또한, 벡터에 숫자를 곱해주면 길이만 변합니다.

1보다 크면 길이가 늘어나고, 1보다 작으면 길이가 줄어듭니다. 이를 스칼라곱이라 부릅니다.

벡터끼리 같은 모양을 가지면 덧셈, 뺄셈을 계산할 수 있습니다.

벡터끼리 같은 모양을 가지면 성분곱(Hadmard product)을 계산할 수 있습니다.

numpy library를 이용해 벡터를 계산할 수 있습니다. (필자는 colab을 이용했습니다.)

두 벡터의 덧셈은 다른 벡터로부터 상대적 위치이동을 표현합니다.

 

두 벡터의 y - x 벡터는 y 벡터에서 -x 벡터를 더한다고 생각하면 됩니다.

 

벡터의 노름(norm)은 원점에서부터의 거리를 말합니다.

L1-노름은 각 성분의 변화량의 절대값을 모두 더합니다.

 

L2-노름은 피타고라스 정리를 이용해 유클리드 거리를 계산합니다.

 

파이썬 넘파이 라이브러리를 통해 벡터의 노름을 구해봅시다.

np.abs 는 값의 절대값을 구해주고, np.sum은 값의 합계를 구해줍니다. np.sqrt는 값의 제곱근을 구해줍니다.

 

 

노름의 종류에 따라 기하학적 성질이 달라집니다. 머신러닝에선 각 성질들이 필요할 때가 있으므로 둘 다 사용합니다.

어떤 노름을 사용할 지 정할때 기하학적 성질을 많이 고려하기 때문에 기하학적 성질을 잘 알아둡시다.

 

두 벡터 사이의 거리를 계산할 때 벡터의 뺄셈을 이용합니다. 

 

두 벡터 사이의 거리를 이용하여 각도를 계산할 수 있습니다.

제 2 코사인 법칙을 이용해 두 벡터 사이의 각도를 계산할 수 있습니다.

 

분자를 쉽게 계산하는 방법이 내적입니다.

내적(inner product)를 np.inner을 이용하여 계산할 수 있습니다.

이 때 주의할 점은, L2 노름에서만 이용가능하고 L1 노름에서는 이용할 수 없습니다.

 

내적은 정사영된 벡터의 길이와 관련있습니다.

정사영(x)는 벡터 y로 정사영된 벡터 x의 그림자를 의미합니다.

Proj(x)의 길이는 코사인 법칙에 의해 ||x||의 cos(theta)가 됩니다.

내적은 정사영의 길이를 벡터 y의 길이 ||y||만큼 조정한 값입니다.

 

따라서 내적은 두 벡터의 유사도(similarity)를 측정하는데 사용가능합니다.


출처

 

[부스트캠프 AI Tech 3기] Pre-Course

부스트코스 무료 강의

www.boostcourse.org

 

728x90