Łączny rozkład prawdopodobieństwa

Łączny rozkład prawdopodobieństwa[1] (rzadziej wspólny rozkład prawdopodobieństwa, ang. joint probability distribution) – rodzaj rozkładu prawdopodobieństwa, który zmiennym losowym X, Y, .... przypisuje prawdopodobieństwo, iż zmienne X, Y, .... przyjmą określone wartości (ciągłe lub dyskretne, należące do specyficznych dla każdej z nich zbiorów wartości).

Czarne punkty uzyskane z pomiaru dwóch zmiennych losowych X, Y – większej gęstości punktów w pobliżu danego punktu (x, y) odpowiada większe łączne prawdopodobieństwo, że X przyjmie wartość w pobliżu x, a Y w pobliżu y. Pokazano też rozkłady brzegowe P(X=x) oraz P(Y=y).

Jeśli mamy tylko dwie zmienne losowe, to rozkład nazywamy dwuwymiarowym, a dla większej liczby zmiennych losowych rozkład nazywamy wielowymiarowym.

Łączny rozkład prawdopodobieństwa może zostać wyrażony także jako łączna dystrybuanta, łączna funkcja gęstości prawdopodobieństwa (w przypadku zmiennych ciągłych) lub łączna funkcja masy prawdopodobieństwa (w przypadku zmiennych dyskretnych). Te z kolei mogą być wykorzystywane do znalezienia dwóch innych rodzajów rozkładów: rozkładu brzegowego (czyli rozkładu prawdopodobieństwa dla jakiejś jednej zmiennej losowej bez odniesienia do pozostałych zmiennych) oraz rozkładu warunkowego (czyli rozkładu prawdopodobieństwa dla wybranego podzbioru zmiennych losowych przy ustalonych wartościach pozostałych zmiennych).

Przykład

edytuj

Rozważmy rzut sześcienną kostką do gry i skonstruujmy następujące zmienne: A = 1, jeśli wypadnie liczba parzysta (2, 4 lub 6), oraz A = 0, jeśli wypadnie liczba nieparzysta (1, 3 lub 5). Analogicznie, B = 1, jeśli wypadnie liczba pierwsza (2, 3 lub 5), oraz B = 0, jeśli wypadnie inna liczba (1, 4 lub 6).

1 2 3 4 5 6
A 0 1 0 1 0 1
B 0 1 1 0 1 0

Wtedy łączny rozkład prawdopodobieństwa dla A i B, wyrażony jako funkcja masy prawdopodobieństwa, wynosi

 
 
 
 

Ważne rodzaje rozkładów

edytuj

Nazwanymi przykładami rozkładów łącznych są: wielowymiarowy rozkład normalny, rozkład wielomianowy, ujemny rozkład wielomianowy, wielowymiarowy rozkład hipergeometryczny i rozkład eliptyczny.

Dystrybuanta

edytuj

Łączny rozkład prawdopodobieństwa dla pary zmiennych losowych może być wyrażona w terminie ich dystrybuanty:

 

Funkcja gęstości lub funkcja masy

edytuj

Rozkłady dyskretne

edytuj

Łączna funkcja masy prawdopodobieństwa dla dwóch zmiennych losowych dyskretnych jest równa

 

Łączny rozkład prawdopodobieństwa   zmiennych losowych dyskretnych   jest równy

 

Tożsamość ta jest znana w teorii prawdopodobieństwa pod nazwą reguła łańcuchowa.

Ponieważ są to prawdopodobieństwa, w przypadku dwóch zmiennych mamy

 

które uogólniają   zmiennych losowych dyskretnych   do

 

Rozkłady ciągłe

edytuj

Łączna funkcja gęstości prawdopodobieństwa   dla zmiennych losowych ciągłych wynosi

 

gdzie   i   dają rozkład warunkowy, gdzie   równa się   a   równa się   natomiast   i   dają rozkład brzegowy odpowiednio dla   i  

Ponieważ są to rozkłady prawdopodobieństwa, po połączeniu ich uzyskamy:

 

Łączny rozkład dla zmiennych niezależnych

edytuj

Jeśli dla zmiennych losowych dyskretnych   dla wszystkich   i   całkowicie zmiennych losowych ciągłych   dla wszystkich   i   wtedy   i   są uważane za niezależne. Oznacza to, że pozyskiwanie informacji o wartości jednej lub więcej zmiennych losowych prowadzi do rozkładu warunkowego innych zmiennych, który jest identyczny do rozkładu bezwarunkowego (brzegowego), zatem nie zmienne są źródłem informacji o zmiennych losowych.

Łączny rozkład dla zmiennych zależnych warunkowo

edytuj

Jeśli podzbiór   zmiennych   jest warunkowo zależny od innego podzbioru   tych zmiennych, wówczas łączny rozkład   można zapisać jako  . Dzięki temu rozkład ten można skutecznie przedstawić za pomocą mniejszych wielowymiarowych rozkładów prawdopodobieństwa   oraz  . Zależności warunkowe (ang. conditional independence relations) tego typu mogą być modelowane za pomocą sieci bayesowskich.

Zobacz też

edytuj

Przypisy

edytuj
  1. Jacek Koronacki, Jan Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych, Wyd. 3, Warszawa: Wydawnictwa Naukowo-Techniczne, 2006, s. 122, ISBN 978-83-204-3242-8 [dostęp 2025-01-01] (pol.).

Bibliografia

edytuj