본문 바로가기

반응형

전체 글

(128)
[ML] 지수 분포 (Exponential Distribution)란? 1. 소개 지수 분포는 확률 분포 중에서도 많이 사용되는 분포 중 하나입니다. 이 분포는 한 가지 이벤트가 발생한 후 다음 이벤트가 발생하기까지 걸리는 시간을 모델링하는데 사용됩니다. 예를 들어, 어떤 공정에서 제품의 고장 시간, 서버의 서비스 시간, 대기열 처리 시간 등 다양한 경우에 지수 분포가 적용될 수 있습니다. 지수 분포는 연속 확률 분포로서, 시간의 단위에 따라 표현됩니다. 이 분포의 특징은 양수 값만을 가지며, 오른쪽으로 꼬리가 길게 늘어진 형태를 보입니다. 이러한 특성으로 인해, 지수 분포는 사건이 발생하는 빈도나 간격에 관심이 있는 경우에 많이 사용됩니다. 이번 글에서는 지수 분포의 개념과 수학적 특징에 대해 알아보겠습니다. 또한, 파이썬을 사용하여 지수 분포를 실험하는 예제도 함께 다룰..
[ML] 감마 분포 (Gamma Distribution)란? 1. 감마 분포에 대한 소개 확률 이론에서 감마 분포 (Gamma Distribution)는 연속형 확률 분포 중 하나로, 양의 실수값을 가지는 확률 변수에 적용됩니다. 감마 분포는 위험 분석, 의학 통계, 품질 관리 등에 널리 사용되며, 특히 시간에 따른 사건의 발생 횟수를 모델링하는 데 사용됩니다. 이번 글에서는 감마 분포의 수식, 특징, 파라미터 설정 방법부터 시작하여 파이썬을 이용하여 감마 분포를 시각화하고 샘플을 추출하는 실습까지 진행하겠습니다. 감마 분포 이론을 이해하고 Python 코드를 통해 실험해보면서, 감마 분포의 활용에 대해 더 깊은 이해를 가질 수 있을 것입니다. 실습 코드와 함께 설명된 예제를 통해 감마 분포를 직관적으로 이해하고, 실제 데이터에 적용하는 방법을 익힐 수 있습니다...
[ML] 베타 분포 (Beta Distribution)란? 1. Beta 분포 소개 베타 분포(Beta distribution)는 확률 분포의 하나로, [0, 1] 구간에서 정의되는 연속형 확률 분포이다. 베타 분포는 Beta(α, β)로 표기되며, α와 β는 분포의 모양을 결정하는 파라미터이다. 베타 분포는 다양한 분야에서 활발하게 사용되며, 특히 베이지안 통계학에서 사전 분포(prior distribution)를 나타내는데 많이 사용된다. 1.1 베타 분포 함수의 수식 베타 분포의 확률 밀도 함수(probability density function, PDF)는 다음과 같이 표현된다. 여기서 B(α, β)는 베타 함수(Beta function)로서, 다음과 같이 정의된다. 여기서 Γ(·)는 감마 함수(Gamma function)로서, 다음과 같이 정의된다. 1..
[ML] 다항 분포(Multinomial distribution)란? 다항 분포란? 다항 분포(Multinomial distribution)는 이산적인 확률 분포 중 하나로, 여러 개의 범주를 가진 확률적인 실험을 모델링할 때 사용된다. 각각의 범주마다 확률이 주어지고, 실험을 통해 이러한 범주 중 하나가 관찰될 확률을 계산하는데 사용됩니다. 예를 들어, 주사위를 던지는 실험을 생각해보자. 6개의 면을 가진 주사위를 10번 던진다고 가정하면, 각 면이 나올 확률은 동일하지 않을 수 있습니다. 다항 분포를 사용하면 주사위의 각 면이 나올 확률을 정의하고, 실험 결과를 통해 실제로 각 면이 나올 확률을 추정할 수 있습니다. 다항 분포는 베르누이 분포(Bernoulli distribution)로부터 파생된 확률 분포로 볼 수 있습니다. 베르누이 분포는 2개의 범주를 가지는 이진..
[ML] 이항 분포(Binomial Distribution)란? 1. 이항 분포란? 이항 분포는 주어진 횟수(n)만큼의 독립적인 시행을 수행할 때, 각 시행이 성공 혹은 실패로 나뉠 때 사용되는 확률 분포입니다. 각 시행마다 성공 확률이 p이며, 실패 확률은 1-p라고 가정합니다. 예를 들어, 동전 던지기를 10번 시행한다고 가정해봅시다. 각 시행마다 앞면이 나올 확률은 0.5이며, 뒷면이 나올 확률은 0.5입니다. 이 때 성공은 앞면이, 실패는 뒷면이라고 정의할 수 있습니다. 이 경우 이항 분포를 사용하여 동전이 앞면이 나올 횟수에 대한 확률을 계산할 수 있습니다. 이항 분포는 성공 확률(p), 시행 횟수(n), 성공 횟수(k)에 따라 다음과 같이 확률 함수로 정의됩니다: P(X = k) = nCk * p^k * (1-p)^(n-k) 여기서 nCk는 n개 중에서 k..
[ML] 정규 분포(Normal distribution)란? 1. 정규 분포란? 정규 분포(Normal Distribution)는 통계학에서 가장 중요하고 널리 사용되는 확률 분포입니다. 정규 분포는 평균을 중심으로 하며, 종모양의 대칭적인 형태를 가지고 있습니다. 또한, 중심극한정리(Central Limit Theorem)에 의해 많은 독립적인 확률 변수들의 합으로 표현될 수 있는 분포로서, 다양한 자연 현상을 표현하는 데 사용됩니다. 정규 분포는 다음과 같은 특성을 가지고 있습니다. 평균과 분산에 의해 전체적인 분포의 모양이 결정됩니다. 평균을 중심으로 하며, 좌우대칭인 형태를 가집니다. 표준 편차가 작을수록 분포가 좁고, 표준 편차가 클수록 분포가 넓어집니다. 평균에서 대부분의 값들이 몰려 있으며, 멀리 떨어진 값들은 매우 적은 빈도를 가집니다. 분포의 총 ..
[ML] 베르누이 분포(Bernoulli Distribution)란? 1. 베르누이 분포란? 1.1 이산 확률 분포의 개념과 유형 소개 확률 분포란, 어떤 사건이 발생할 확률의 분포를 의미합니다. 이산 확률 분포는 이벤트의 결과가 이산적인(discrete) 값을 가지는 경우에 사용됩니다. 예를 들어, 동전 던지기의 경우 앞면(Head) 또는 뒷면(Tail)으로 결과가 나뉘므로 이산 확률 분포로 모델링할 수 있습니다. 1.2 베르누이 분포의 기본 개념과 특징 설명 베르누이 분포는 가장 간단한 이산 확률 분포 중 하나입니다. 베르누이 분포는 단 하나의 이벤트에서 두 가지 결과 중 하나만 나오는 경우에 사용됩니다. 예를 들어, 동전 던지기의 경우 앞면(Head)이 나오는 확률과 뒷면(Tail)이 나오는 확률이 각각 다르기 때문에 베르누이 분포로 모델링할 수 있습니다. 특히, 베..
[ML] 머신 러닝에서 사용되는 11가지 확률 분포 함수 소개 ( 파이썬 ) 1. 소개 확률 함수는 머신 러닝에서 중요한 개념 중 하나로, 데이터의 확률적 관계를 모델링하는 데 사용됩니다. 확률 함수는 입력값에 대해 어떤 확률을 예측하거나, 데이터의 분포를 모델링하는 데 활용됩니다. 머신 러닝은 데이터로부터 패턴을 학습하는 기법으로, 데이터의 분포와 특성 사이의 관계를 이해하는 것이 중요합니다. 확률 함수는 이러한 관계를 고려하여 데이터에 대한 예측 또는 각 데이터 포인트의 확률을 계산하는 데 사용됩니다. 이 블로그 글에서는 확률 함수의 개념과 특성에 대해 소개하고, 대표적인 확률 함수들을 살펴볼 것입니다. 또한, 확률 함수를 이용한 머신 러닝 예시를 통해 실제 응용 사례도 살펴볼 것입니다. 확률 함수를 잘 이해하고 활용하는 것은 머신 러닝 모델의 성능을 향상시키고, 데이터에 대..

반응형