본문 바로가기

Mathematics9

Marginalize "Marginalize"는 통계학과 확률론에서 주로 사용되는 말로, 하나 또는 그 이상의 변수의 확률분포를 얻기 위해 다변수 확률 분포에서 일부 변수의 영향을 "제거"하는 과정을 의미한다. 이 과정은 다변수 시스템에서 특정 변수에만 집중하고자 할 때 사용된다. 예를 들어, 두 변수 $X$와 $Y$가 있는 결합 확률 분포 $P(X,Y)$가 있다고 가정해보자. 만약 변수 $Y$에 대해서만 관심이 있고, $X$의 영향을 무시하고자 한다면, $X$에 대해 marginalization을 수행하여 $Y$의 주변 확률 분포(marginal probability distribution) $P(Y)$를 다음과 같이 계산할 수 있다.이 식은 모든 가능한 $X$의 값에 대해 결합 확률을 합산하여 $Y$의 확률만을 남기는 것.. 2024. 11. 10.
Mahalanobis distance (마할라노비스 거리) 점 P와 분포 D 사이의 거리를 측정한 것으로, 점 P가 분포 D의 평균값에서 얼마나 많은 표준편차만큼 떨어져 있는지 나타낸다.  $ d_m = d(u,v) = \sqrt{(u-v){\sum}^{-1}(u-v)^{T}} $  위 식은 posterior이므로, $gi(x)">g_i(x)$의 값이 가장 큰 클래스를 선택해야 함마이너스가 있으므로, (x−μi)TΣi−1(x−μi)">마할라노비스 거리가 가장 작은 클래스가 가장 큰 posterior를 가지게됨 2024. 5. 14.
Similarity Measure (기본적인 유사도 측정법) 1. Euclidean distance (유클리디안 거리)두 벡터 거리 간의 직선 거리 측정법 2. Manhattan Distance (맨해튼 거리)데카르트 좌표계 상, 두 벡터 차의 절댓값의 합 3.Minkowski Distance (민코프스키 거리)유클리드 거리와 맨해튼 거리를 일반화  n 차원 점 X, Y에 대해 p차 민코프스키 거리 p = 1일 경우 맨해튼 거리와 동일, L1 normp = 2일 경우 유클리드 거리와 동일, L2 normp = ∞일 경우 체비쇼프 거리(Chebyshev Distance)와 동일, L max norm 4. Cosine Similarity (코사인 유사도)두 벡터가 이루는 각도를 통해 유사도를 측정두 벡터가 이루는 각이 작을 수록 유사도가 높은 것이고, 각이 클수록 유.. 2024. 5. 14.
Markov Chain (마르코프 체인) 1. 개념 Markov chain은 Markov 성질(특정 상태의 확률은 오직 과거의 상태에 의존하는 것)을 가진 이산확률과정(Discrete-time Stochastic Process)이다. 예를 들어, 오늘의 날씨가 맑다면 내일의 날씨는 맑을지 비가 내릴지를 확률적으로 표현할 수 있다. 여러 상태들($x_1, x_2, x_3, ...$)이 있고, $x_i$에서 $x_j$로 이동할 조건부 확률분포(transition distribution) $T(x_j|x_i)$가 주어져 있어서 매턴마다 이 확률 값에 따라 상태들 사이를 이동하는 것을 말한다. 이는 확률이 정해져 있으므로 "특정조건"을 만족할 때는 일정한 패턴이 나타나게 된다. 예를 들어, "100번 이동했다면 평균적으로 3번은 출발점에 돌아온다"라는.. 2024. 4. 2.