Vals-positieven en vals-negatieven
Vals-positieve en vals-negatieve percentagesEdit
Het vals-positief percentage is het aandeel van alle negatieven dat toch nog een positief testresultaat oplevert, d.w.z. de voorwaardelijke kans op een positief testresultaat gegeven een gebeurtenis die niet aanwezig was.
Het vals-positief percentage is gelijk aan het significantieniveau. De specificiteit van de test is gelijk aan 1 min de vals-positieve waarde.
In de statistische hypothesetoetsing wordt deze fractie aangeduid met de Griekse letter α, en 1 – α wordt gedefinieerd als de specificiteit van de test. Verhoging van de specificiteit van de test verlaagt de kans op type I-fouten, maar kan de kans op type II-fouten (vals-negatieven die de alternatieve hypothese verwerpen terwijl deze waar is) verhogen.
Aanvullend is het vals-negatieve percentage het aandeel positieven dat met de test negatieve testuitkomsten oplevert, d.w.z, de voorwaardelijke kans op een negatieve testuitslag gegeven dat de gezochte aandoening aanwezig is.
In statistische hypothesetoetsing krijgt deze fractie de letter β. De “power” (of de “sensitiviteit”) van de test is gelijk aan 1 – β.
Ambiguïteit in de definitie van vals-positieve rateEdit
De term false discovery rate (FDR) werd door Colquhoun (2014) gebruikt om de kans aan te duiden dat een “significant” resultaat een vals-positief was. Later gebruikte Colquhoun (2017) de term vals-positief risico (FPR) voor dezelfde grootheid, om verwarring te voorkomen met de term FDR zoals gebruikt door mensen die werken aan meervoudige vergelijkingen. Correcties voor meervoudige vergelijkingen hebben alleen tot doel het type I-foutenpercentage te corrigeren, zodat het resultaat een (gecorrigeerde) p-waarde is. Zij zijn dus vatbaar voor dezelfde verkeerde interpretatie als elke andere p-waarde. Het vals-positief risico is altijd hoger, vaak veel hoger, dan de p-waarde.
Verwarring van deze twee ideeën, de fout van de getransponeerde voorwaardelijke, heeft veel onheil veroorzaakt. Vanwege de dubbelzinnigheid van de notatie op dit gebied, is het van essentieel belang om in elk artikel naar de definitie te kijken. De gevaren van het vertrouwen op p-waarden werd benadrukt in Colquhoun (2017) door erop te wijzen dat zelfs een waarneming van p = 0,001 niet noodzakelijk sterk bewijs tegen de nulhypothese was. Ondanks het feit dat de likelihood ratio ten gunste van de alternatieve hypothese boven de nul dicht bij 100 ligt, als de hypothese ongeloofwaardig was, met een voorafgaande waarschijnlijkheid van een echt effect van 0,1, zou zelfs de waarneming van p = 0,001 een vals-positief percentage van 8 procent hebben. Het zou zelfs het niveau van 5 procent niet halen. Bijgevolg wordt aanbevolen om bij elke p-waarde de kans te vermelden dat er een reëel effect is, waarvan moet worden uitgegaan om een fout-positief risico van 5% te bereiken. Bijvoorbeeld, als we p = 0,05 in een enkel experiment waarnemen, zouden we 87% zeker moeten zijn dat er een echt effect is voordat het experiment wordt uitgevoerd om een vals-positief risico van 5% te bereiken.
Receiver operating characteristicEdit
Het artikel “Receiver operating characteristic” bespreekt parameters in statistische signaalverwerking gebaseerd op verhoudingen van fouten van verschillende typen.