Kurtoza

miara kształtu rozkładu cechy statystycznej

Kurtoza (z gr. κυρτός, kyrtos, kurtoswydęty) – jedna z miar kształtu rozkładu wartości cechy statystycznej. W praktyce definiuje się ją najczęściej w formie tzw. kurtozy nadwyżkowej (nazywanej ekscesem lub współczynnikiem ekscesu, ang. excess kurtosis)[1]:

gdzie:

– czwarty moment centralny,
odchylenie standardowe.

Interpretacja

edytuj

Klasyczny współczynnik kurtozy definiowany jest jako standaryzowany moment centralny czwartego rzędu:

 

Kurtoza nadwyżkowa (inaczej współczynnik ekscesu lub po prostu eksces:  ) jest jednak wygodniejsza, gdyż:

  • kurtoza nadwyżkowa rozkładu normalnego wynosi 0,
  • jeśli   jest sumą   niezależnych zmiennych losowych, każdej o rozkładzie identycznym z rozkładem zmiennej losowej   zachodzi własność:  

Wbrew stwierdzeniom obecnym w niektórych podręcznikach, kurtoza nie mierzy „spłaszczenia”, „wysmukłości” ani „spiczastości” rozkładu. Na kurtozę ma wpływ intensywność występowania wartości skrajnych, mierzy więc ona, co się dzieje w „ogonach” rozkładu, natomiast kształt „czubka” rozkładu jest praktycznie bez znaczenia[1][2].

Rozkłady prawdopodobieństwa można podzielić ze względu na wartość kurtozy na rozkłady:

  • mezokurtyczne (KurtE = 0) – wartość kurtozy nadwyżkowej wynosi 0, intensywność wartości skrajnych jest podobna do intensywności wartości skrajnych rozkładu normalnego (dla którego kurtoza nadwyżkowa wynosi dokładnie 0),
  • leptokurtyczne (KurtE > 0) – kurtoza nadwyżkowa jest dodatnia, intensywność wartości skrajnych jest większa niż dla rozkładu normalnego („ogony” rozkładu są „grubsze”),
  • platykurtyczne (KurtE < 0) – kurtoza nadwyżkowa jest ujemna, intensywność wartości skrajnych jest mniejsza niż w przypadku rozkładu normalnego („ogony” rozkładu są „węższe”).

Kurtoza nadwyżkowa z próby wyraża się wzorem:

 

gdzie:

  -ta wartość cechy,
 wartość oczekiwana w populacji,
 odchylenie standardowe w populacji,
  – liczebność próby.

Powyższa statystyka jest obciążonym estymatorem kurtozy nadwyżkowej z populacji, estymator nieobciążony wyraża się wzorem:

 

gdzie:

  – średnia z próby,
 odchylenie standardowe z próby,
  – kolejne wartości cechy,
  – liczebność próby.

Obliczenie kurtozy dla rozkładu normalnego

edytuj

 

Dowód

edytuj

Niech:

 
 
  – moment centralny n–tego rzędu,
  – moment zwykły n–tego rzędu,
Dystrybuanta rozkładu normalnego oraz gęstość prawdopodobieństwa rozkładu normalnego to odpowiednio:
 

Wiadomo, że w rozkładzie normalnym:

 
 

Mamy:

a)
 
b)
 

Obliczamy momenty zwykłe:

 

 
 

 

 

 

 
 

 

 

 
 

 

 

 

 

 

 
 

 

 

 

 

 

 

 

 

 

 

 

Obliczone wartości:

 
 
 

podstawiamy do wzoru na czwarty moment centralny z punktu b):

 

Stąd kurtoza jest równa:

 

Zobacz też

edytuj

Przypisy

edytuj
  1. a b Błażej Kochański, Czy kurtoza mierzy spiczastość rozkładu?, „Wiadomości Statystyczne. The Polish Statistician”, 67 (11), 2022, s. 43–61, DOI10.5604/01.3001.0016.1039, ISSN 2543-8476 [dostęp 2023-04-19].
  2. Peter H. WESTFALL, Kurtosis as Peakedness, 1905 – 2014. R.I.P., „The American statistician”, 68 (3), 2014, s. 191–195, DOI10.1080/00031305.2014.917055, ISSN 0003-1305, PMID25678714, PMCIDPMC4321753 [dostęp 2021-03-15].