Analiza sekwencyjna
Analiza sekwencyjna – technika statystyczna pozwalająca realizować badanie etapowo, i przerwać je gdy tylko jedna z analiz etapowych wykaże, że zebrane do tego momentu wyniki wystarczają do potwierdzenia hipotezy badawczej.
W odróżnieniu od niezaplanowanego „podglądania danych”, które jest nadużyciem metodologicznym, i podwyższa ryzyko błędnego uznania fałszywej hipotezy za prawdziwą (popełnienia błędu I rodzaju), analiza sekwencyjna uwzględnia poprawki na wielokrotne testowanie danych, dzięki czemu kontroluje błąd I rodzaju na nominalnym poziomie istotności. Zatrzymanie pobierania danych następuje zgodnie z predefiniowaną regułą zatrzymania obserwacji. Wniosek można dzięki temu postawić często wcześniej niż w klasycznym podejściu testowania hipotez statystycznych lub estymacji, co zmniejsza koszty badania. Jest to szczególnie użyteczne w obszarach, w których uzyskanie każdej obserwacji jest wyjątkowo drogie, niebezpieczne, lub w inny sposób trudne – np. w wieloletnich medycznych badaniach klinicznych.
Procedury
edytujProste procedury korekcji wartości p dla analiz etapowych zaproponowali m.in. Pocock[1][2], O'Brien i Fleming[3], Haybittle i Peto[4][5], oraz Lan i DeMets[6]. Niektóre z tych metod nazywa się „wydatkowaniem wartości p”, ponieważ w praktyce polegają na proporcjonalnym rozdzielaniu ogólnego, przyjętego ryzyka popełnienia błędu I rodzaju (np. konwencjonalne 5%) na określoną liczbę części.
Należy zaznaczyć, że choć stosuje się niższe nominalne wartości krytyczne w analizach pośrednich, ryzyko popełnienia błędu I rodzaju dla całego badania pozostaje na pełnym poziomie, np. 5%, i tak należy je sprawozdać[7].
Metoda Pococka
edytujMetoda Pococka jest prosta, ale wymaga zaplanowania z góry liczby analiz etapowych[1][2].
Liczba zaplanowanych analiz etapowych | Analiza etapowa | Krytyczna wartość p |
---|---|---|
2 | 1 | 0,0294 |
2 (końcowa) | 0,0294 | |
3 | 1 | 0,0221 |
2 | 0,0221 | |
3 (końcowa) | 0,0221 | |
4 | 1 | 0,0182 |
2 | 0,0182 | |
3 | 0,0182 | |
4 (końcowa) | 0,0182 | |
5 | 1 | 0,0158 |
2 | 0,0158 | |
3 | 0,0158 | |
4 | 0,0158 | |
5 (końcowa) | 0,0158 |
Metoda Haybittle–Peto
edytujMetoda Haybittle–Peto jest bardziej konserwatywna[4][5].
Liczba zaplanowanych analiz etapowych | Analiza etapowa | Krytyczna wartość p |
---|---|---|
2 | 1 | 0,001 |
2 (końcowa) | 0,05 | |
3 | 1 | 0,001 |
2 | 0,001 | |
3 (końcowa) | 0,05 | |
4 | 1 | 0,001 |
2 | 0,001 | |
3 | 0,001 | |
4 (końcowa) | 0,05 | |
5 | 1 | 0,001 |
2 | 0,001 | |
3 | 0,001 | |
4 | 0,001 | |
5 (końcowa) | 0,05 |
Historia
edytujAnaliza sekwencyjna została stworzona przez Abrahama Walda ze współpracownikami na uniwersytecie Columbia jako narzędzie do bardziej efektywnego sterowania jakością produkcji w czasie II wojny światowej. Ze względu na ich dużą użyteczność, były objęte tajemnicą do końca wojny[8]. W późniejszych latach technikę rozwijał m.in. Kenneth Arrow[9].
Metody sekwencyjne były wykorzystywane w trakcie wojny niezależnie przez Alana Turinga, jako część procedury Banburismus, stosowanej w ośrodku kryptograficznym w Bletchley Park do weryfikacji hipotez roboczych na temat tego, czy różne wiadomości szyfrowane Enigmą mogą być łączone razem w celu analizy. Badania te objęte były tajemnicą do początku lat osiemdziesiątych 20. wieku.
Literatura
edytuj- Abraham Wald, "Sequential Tests of Statistical Hypotheses", Annals of Mathematical Statistics, 16, (1945), 117–186
- Abraham Wald, Sequential Analysis, (1947)
- Stanisław Trybuła "Sequential estimation in processses with independent increments", Dissertationes Mathematicae, 60, (1968), 1–46
Zobacz też
edytujLinki zewnętrzne
edytuj- Sequential Analysis – Design Methods and Applications, „Sequential Analysis” [dostęp 2020-03-15] (ang.).
Przypisy
edytuj- ↑ a b Stuart J. Pocock , Group Sequential Methods in the Design and Analysis of Clinical Trials, „Biometrika”, 64 (2), 1977, DOI: 10.2307/2335684, ISSN 0006-3444, JSTOR: 2335684 [dostęp 2017-01-31] (ang.).
- ↑ a b Stuart J. Pocock , Interim Analyses for Randomized Clinical Trials: The Group Sequential Approach, „Biometrics”, 38 (1), 1982, s. 153–162, DOI: 10.2307/2530298, JSTOR: 2530298 [dostęp 2017-01-31] .
- ↑ Peter C. O'Brien , Thomas R. Fleming , A Multiple Testing Procedure for Clinical Trials, „Biometrics”, 35 (3), 1979, s. 549–556, DOI: 10.2307/2530245, JSTOR: 2530245 [dostęp 2017-01-31] .
- ↑ a b J.L. Haybittle , Repeated assessment of results in clinical trials of cancer treatment, „The British Journal of Radiology”, 44 (526), 1971, s. 793–797, DOI: 10.1259/0007-1285-44-526-793, ISSN 0007-1285 [dostęp 2017-01-31] .
- ↑ a b R. Peto i inni, Design and analysis of randomized clinical trials requiring prolonged observation of each patient. I. Introduction and design, „British Journal of Cancer”, 34 (6), 1976, s. 585–612, DOI: 10.1038/bjc.1976.220, ISSN 0007-0920 [dostęp 2017-01-31] (ang.).
- ↑ K.K. GORDON LAN , DAVID L. DEMETS , Discrete sequential boundaries for clinical trials, „Biometrika”, 70 (3), 1983, s. 659–663, DOI: 10.1093/biomet/70.3.659, ISSN 0006-3444 [dostęp 2017-01-31] (ang.).
- ↑ Kenneth F Schulz , David A Grimes , Multiplicity in randomised trials II: subgroup and interim analyses, „The Lancet”, 365 (9471), s. 1657–1661, DOI: 10.1016/s0140-6736(05)66516-6 .
- ↑ Jean-François Hêche , Thomas M. Liebling , Dominique de Werra , Recherche opérationnelle pour ingénieurs, PPUR presses polytechniques, 2003, s. 145, ISBN 978-2-88074-459-5 [dostęp 2017-01-31] (fr.).
- ↑ K.J. Arrow , D. Blackwell , M.A. Girshick , Bayes and Minimax Solutions of Sequential Decision Problems, „Econometrica”, 17 (3/4), 1949, s. 213–244, DOI: 10.2307/1905525, JSTOR: 1905525 [dostęp 2017-01-31] .