Fałszywe wyniki dodatnie i fałszywe wyniki ujemne
Współczynnik fałszywie dodatni i fałszywie ujemnyEdit
Współczynnik fałszywie dodatni to odsetek wszystkich wyników ujemnych, które nadal dają dodatnie wyniki testu, tj. warunkowe prawdopodobieństwo dodatniego wyniku testu przy założeniu zdarzenia, które nie było obecne.
Współczynnik fałszywie dodatni jest równy poziomowi istotności. Swoistość testu jest równa 1 minus współczynnik fałszywych wyników pozytywnych.
W testowaniu hipotez statystycznych, ten ułamek jest oznaczany grecką literą α, a 1 – α jest definiowany jako swoistość testu. Zwiększenie specyficzności testu obniża prawdopodobieństwo wystąpienia błędów typu I, ale może zwiększyć prawdopodobieństwo wystąpienia błędów typu II (fałszywie ujemnych, które odrzucają hipotezę alternatywną, gdy jest ona prawdziwa).
W uzupełnieniu, współczynnik fałszywie ujemny to odsetek wyników dodatnich, które dają ujemny wynik testu, tj, warunkowe prawdopodobieństwo negatywnego wyniku testu przy założeniu, że poszukiwany stan jest obecny.
W testowaniu hipotez statystycznych, ułamek ten jest oznaczany literą β. „Moc” (lub „czułość”) testu jest równa 1 – β.
Niejednoznaczność w definicji współczynnika fałszywych wyników pozytywnychEdit
Pojęcie współczynnika fałszywego odkrycia (FDR) zostało użyte przez Colquhouna (2014) w celu określenia prawdopodobieństwa, że „znaczący” wynik był fałszywie pozytywny. Później Colquhoun (2017) użył terminu false positive risk (FPR) dla tej samej wielkości, aby uniknąć pomyłki z terminem FDR używanym przez ludzi, którzy pracują nad wielokrotnymi porównaniami. Korekty dla wielokrotnych porównań mają na celu jedynie skorygowanie stopy błędu typu I, więc wynikiem jest (skorygowana) wartość p. Dlatego są one podatne na taką samą błędną interpretację, jak każda inna wartość p. Ryzyko fałszywie pozytywnego wyniku jest zawsze wyższe, często znacznie wyższe, niż wartość p.
Konfuzja tych dwóch idei, błąd transponowanego warunkowego, spowodowała wiele złośliwości. Ze względu na niejednoznaczność notacji w tej dziedzinie, istotne jest, aby spojrzeć na definicję w każdym dokumencie. Niebezpieczeństwa związane z poleganiem na wartościach p podkreślono w Colquhoun (2017) wskazując, że nawet obserwacja p = 0,001 niekoniecznie jest silnym dowodem przeciwko hipotezie zerowej. Pomimo faktu, że współczynnik prawdopodobieństwa na korzyść hipotezy alternatywnej w stosunku do zerowej jest bliski 100, jeśli hipoteza była nieprawdopodobna, z wcześniejszym prawdopodobieństwem rzeczywistego efektu wynoszącym 0,1, nawet obserwacja p = 0,001 miałaby wskaźnik fałszywych pozytywów na poziomie 8 procent. Nie osiągnąłby on nawet poziomu 5 procent. W związku z tym zaleca się, aby każdej wartości p towarzyszyło prawdopodobieństwo istnienia rzeczywistego efektu, które należałoby założyć, aby osiągnąć ryzyko fałszywego wyniku dodatniego na poziomie 5%. Na przykład, jeśli obserwujemy p = 0,05 w pojedynczym eksperymencie, musielibyśmy być pewni w 87%, że istnieje prawdziwy efekt przed wykonaniem eksperymentu, aby osiągnąć ryzyko fałszywie pozytywnego wyniku 5%.
Charakterystyka odbiorczaEdit
Artykuł „Receiver operating characteristic” omawia parametry w statystycznym przetwarzaniu sygnałów oparte na stosunkach błędów różnych typów.
W artykule „Receiver operating characteristic” omówiono parametry w statystycznym przetwarzaniu sygnałów oparte na stosunkach błędów różnych typów.