Analiza sekwencyjna

Analiza sekwencyjna – technika statystyczna pozwalająca realizować badanie etapowo, i przerwać je gdy tylko jedna z analiz etapowych wykaże, że zebrane do tego momentu wyniki wystarczają do potwierdzenia hipotezy badawczej.

W odróżnieniu od niezaplanowanego „podglądania danych”, które jest nadużyciem metodologicznym, i podwyższa ryzyko błędnego uznania fałszywej hipotezy za prawdziwą (popełnienia błędu I rodzaju), analiza sekwencyjna uwzględnia poprawki na wielokrotne testowanie danych, dzięki czemu kontroluje błąd I rodzaju na nominalnym poziomie istotności. Zatrzymanie pobierania danych następuje zgodnie z predefiniowaną regułą zatrzymania obserwacji. Wniosek można dzięki temu postawić często wcześniej niż w klasycznym podejściu testowania hipotez statystycznych lub estymacji, co zmniejsza koszty badania. Jest to szczególnie użyteczne w obszarach, w których uzyskanie każdej obserwacji jest wyjątkowo drogie, niebezpieczne, lub w inny sposób trudne – np. w wieloletnich medycznych badaniach klinicznych.

Procedury

edytuj

Proste procedury korekcji wartości p dla analiz etapowych zaproponowali m.in. Pocock[1][2], O'Brien i Fleming[3], Haybittle i Peto[4][5], oraz Lan i DeMets[6]. Niektóre z tych metod nazywa się „wydatkowaniem wartości p”, ponieważ w praktyce polegają na proporcjonalnym rozdzielaniu ogólnego, przyjętego ryzyka popełnienia błędu I rodzaju (np. konwencjonalne 5%) na określoną liczbę części.

Należy zaznaczyć, że choć stosuje się niższe nominalne wartości krytyczne w analizach pośrednich, ryzyko popełnienia błędu I rodzaju dla całego badania pozostaje na pełnym poziomie, np. 5%, i tak należy je sprawozdać[7].

Metoda Pococka

edytuj

Metoda Pococka jest prosta, ale wymaga zaplanowania z góry liczby analiz etapowych[1][2].

Przykładowe skorygowane wartości p dla analiz etapowych, przy założeniu że w badaniu przyjęto poziom istotności α=0,05
Liczba zaplanowanych analiz etapowych Analiza etapowa Krytyczna wartość p
2 1 0,0294
  2 (końcowa) 0,0294
3 1 0,0221
  2 0,0221
  3 (końcowa) 0,0221
4 1 0,0182
  2 0,0182
  3 0,0182
  4 (końcowa) 0,0182
5 1 0,0158
  2 0,0158
  3 0,0158
  4 0,0158
  5 (końcowa) 0,0158

Metoda Haybittle–Peto

edytuj

Metoda Haybittle–Peto jest bardziej konserwatywna[4][5].

Przykładowe skorygowane wartości p dla analiz etapowych, przy założeniu że w badaniu przyjęto poziom istotności α=0,05
Liczba zaplanowanych analiz etapowych Analiza etapowa Krytyczna wartość p
2 1 0,001
  2 (końcowa) 0,05
3 1 0,001
  2 0,001
  3 (końcowa) 0,05
4 1 0,001
  2 0,001
  3 0,001
  4 (końcowa) 0,05
5 1 0,001
  2 0,001
  3 0,001
  4 0,001
  5 (końcowa) 0,05

Historia

edytuj

Analiza sekwencyjna została stworzona przez Abrahama Walda ze współpracownikami na uniwersytecie Columbia jako narzędzie do bardziej efektywnego sterowania jakością produkcji w czasie II wojny światowej. Ze względu na ich dużą użyteczność, były objęte tajemnicą do końca wojny[8]. W późniejszych latach technikę rozwijał m.in. Kenneth Arrow[9].

Metody sekwencyjne były wykorzystywane w trakcie wojny niezależnie przez Alana Turinga, jako część procedury Banburismus, stosowanej w ośrodku kryptograficznym w Bletchley Park do weryfikacji hipotez roboczych na temat tego, czy różne wiadomości szyfrowane Enigmą mogą być łączone razem w celu analizy. Badania te objęte były tajemnicą do początku lat osiemdziesiątych 20. wieku.

Literatura

edytuj
  • Abraham Wald, "Sequential Tests of Statistical Hypotheses", Annals of Mathematical Statistics, 16, (1945), 117–186
  • Abraham Wald, Sequential Analysis, (1947)
  • Stanisław Trybuła "Sequential estimation in processses with independent increments", Dissertationes Mathematicae, 60, (1968), 1–46

Zobacz też

edytuj

Linki zewnętrzne

edytuj

Przypisy

edytuj
  1. a b Stuart J. Pocock, Group Sequential Methods in the Design and Analysis of Clinical Trials, „Biometrika”, 64 (2), 1977, DOI10.2307/2335684, ISSN 0006-3444, JSTOR2335684 [dostęp 2017-01-31] (ang.).
  2. a b Stuart J. Pocock, Interim Analyses for Randomized Clinical Trials: The Group Sequential Approach, „Biometrics”, 38 (1), 1982, s. 153–162, DOI10.2307/2530298, JSTOR2530298 [dostęp 2017-01-31].
  3. Peter C. O'Brien, Thomas R. Fleming, A Multiple Testing Procedure for Clinical Trials, „Biometrics”, 35 (3), 1979, s. 549–556, DOI10.2307/2530245, JSTOR2530245 [dostęp 2017-01-31].
  4. a b J.L. Haybittle, Repeated assessment of results in clinical trials of cancer treatment, „The British Journal of Radiology”, 44 (526), 1971, s. 793–797, DOI10.1259/0007-1285-44-526-793, ISSN 0007-1285 [dostęp 2017-01-31].
  5. a b R. Peto i inni, Design and analysis of randomized clinical trials requiring prolonged observation of each patient. I. Introduction and design, „British Journal of Cancer”, 34 (6), 1976, s. 585–612, DOI10.1038/bjc.1976.220, ISSN 0007-0920 [dostęp 2017-01-31] (ang.).
  6. K.K. GORDON LAN, DAVID L. DEMETS, Discrete sequential boundaries for clinical trials, „Biometrika”, 70 (3), 1983, s. 659–663, DOI10.1093/biomet/70.3.659, ISSN 0006-3444 [dostęp 2017-01-31] (ang.).
  7. Kenneth F Schulz, David A Grimes, Multiplicity in randomised trials II: subgroup and interim analyses, „The Lancet”, 365 (9471), s. 1657–1661, DOI10.1016/s0140-6736(05)66516-6.
  8. Jean-François Hêche, Thomas M. Liebling, Dominique de Werra, Recherche opérationnelle pour ingénieurs, PPUR presses polytechniques, 2003, s. 145, ISBN 978-2-88074-459-5 [dostęp 2017-01-31] (fr.).
  9. K.J. Arrow, D. Blackwell, M.A. Girshick, Bayes and Minimax Solutions of Sequential Decision Problems, „Econometrica”, 17 (3/4), 1949, s. 213–244, DOI10.2307/1905525, JSTOR1905525 [dostęp 2017-01-31].