Wiarygodność i rzetelność w badaniach ilościowych | Evidence-Based Nursing
Reliability
Reliability odnosi się do spójności pomiaru. Uczestnik wypełniający narzędzie do pomiaru motywacji powinien mieć w przybliżeniu takie same odpowiedzi za każdym razem, kiedy wypełnia test. Chociaż nie jest możliwe dokładne obliczenie rzetelności, szacunkową rzetelność można osiągnąć za pomocą różnych środków. Trzy atrybuty rzetelności zostały przedstawione w tabeli 2. Poniżej opisano sposób testowania każdego z atrybutów.
- View inline
- View popup
Atrybuty rzetelności
Homogeniczność (spójność wewnętrzna) jest oceniana przy użyciu korelacji item-to-total, rzetelności dzielonej połówkowej, współczynnika Kudera-Richardsona i α Cronbacha. W przypadku rzetelności połowicznej wyniki testu lub narzędzia są dzielone na pół. Korelacje oblicza się porównując obie połówki. Silne korelacje wskazują na wysoką rzetelność, podczas gdy słabe korelacje wskazują, że narzędzie może nie być rzetelne. Test Kudera-Richardsona jest bardziej skomplikowaną wersją testu połówkowego. W tym procesie określana jest średnia wszystkich możliwych kombinacji połówek i generowana jest korelacja pomiędzy 0-1. Test ten jest bardziej dokładny niż test połówkowy, ale może być przeprowadzony tylko dla pytań z dwiema odpowiedziami (np. tak lub nie, 0 lub 1).3
Test α Cronbacha jest najczęściej stosowanym testem do określenia wewnętrznej spójności narzędzia. W tym teście określa się średnią wszystkich korelacji w każdej kombinacji rozkładów. Instrumenty z pytaniami, które mają więcej niż dwie odpowiedzi mogą być użyte w tym teście. Wynik α Cronbacha jest liczbą z przedziału od 0 do 1. Akceptowalny wynik rzetelności to taki, który wynosi 0,7 i więcej.1,3
Stabilność jest badana przy użyciu testu-retest i testu rzetelności równoległej lub alternatywnej formy. Wiarygodność test-retest jest oceniana, gdy narzędzie jest podawane tym samym uczestnikom więcej niż raz w podobnych okolicznościach. Dokonuje się statystycznego porównania wyników testu uzyskanych przez uczestników za każdym razem, gdy go wypełniali. To dostarcza wskazówek na temat rzetelności narzędzia. Rzetelność równoległa (lub alternatywna) jest podobna do rzetelności test-retest, z tą różnicą, że uczestnikom w kolejnych testach podaje się inną formę oryginalnego narzędzia. Badana dziedzina lub koncepcje są takie same w obu wersjach instrumentu, ale brzmienie pozycji jest inne.2 Aby instrument wykazywał stabilność, powinna istnieć wysoka korelacja pomiędzy wynikami za każdym razem, kiedy uczestnik wypełnia test. Ogólnie rzecz biorąc, współczynnik korelacji mniejszy niż 0,3 oznacza słabą korelację, 0,3-0,5 umiarkowaną, a większy niż 0,5 silną.4
Równoważność jest oceniana poprzez rzetelność międzylaboratoryjną. Test ten obejmuje proces jakościowego określania poziomu zgodności pomiędzy dwoma lub więcej obserwatorami. Dobrym przykładem procesu stosowanego w ocenie wiarygodności międzysędziowskiej są oceny sędziów na zawodach łyżwiarskich. Poziom zgodności wszystkich sędziów w ocenach przyznawanych uczestnikom zawodów łyżwiarskich jest miarą rzetelności międzyosobowej. Przykładem w badaniach jest sytuacja, w której badacze są proszeni o przyznanie punktów za trafność każdego elementu narzędzia. Spójność w ich punktacji odnosi się do poziomu wiarygodności międzylaboratoryjnej instrumentu.
Określenie, jak rygorystycznie kwestie wiarygodności i rzetelności zostały potraktowane w badaniu, jest istotnym elementem krytyki badań, jak również wpływa na decyzję o tym, czy wprowadzić wyniki badania do praktyki pielęgniarskiej. W badaniach ilościowych rygor jest określany poprzez ocenę ważności i wiarygodności narzędzi lub instrumentów wykorzystanych w badaniu. Dobrej jakości badania dostarczą dowodów na to, jak wszystkie te czynniki zostały uwzględnione. Pomoże to w ocenie ważności i wiarygodności badań oraz w podjęciu decyzji o zastosowaniu wyników w swojej praktyce klinicznej.