量的研究における妥当性と信頼性|Evidence-Based Nursing(エビデンスベースドナー)
信頼性
信頼性とは、測定値の一貫性に関するものです。 モチベーションを測定するための機器を完成させた参加者は、テストを完了するたびにほぼ同じ回答をするはずです。 信頼性を正確に計算することはできませんが、信頼性の推定値はさまざまな方法で達成することができます。 信頼性の3つの属性は、表2にまとめられています。 各属性がどのようにテストされるかは以下の通りです。
- View inline
- View popup
信頼性の属性
同質性(内部一貫性)は、項目間相関、スプリットハーフ信頼性、Kuder-Richardson係数、Cronbach’s αなどで評価します。 半分ずつの信頼性では、テストや機器の結果を半分に分けます。 両者を比較して相関関係を求めます。 強い相関は信頼性が高いことを示し、弱い相関は機器の信頼性が低い可能性を示します。 Kuder-Richardsonテストは、split-halfテストのより複雑なバージョンです。 このプロセスでは、すべての可能なスプリットハーフの組み合わせの平均が決定され、0-1の相関が生成されます。 このテストはスプリットハーフテストよりも正確ですが、2つの答え(例:イエスかノー、0か1)を持つ質問にしか答えることができません3
クロンバックのαは、機器の内部一貫性を決定するために最もよく使用されるテストです。 このテストでは、スプリットハーフのすべての組み合わせにおけるすべての相関関係の平均値を求めます。 2つ以上の回答を持つ質問を持つ測定器は、このテストに使用することができます。 クロンバックのα値は0から1の間の数値で、0.7以上が信頼性スコアの許容範囲となります。 テスト・リテスト信頼性は、同じ被験者に同じような環境で2回以上テストを行うことで評価します。 テスト・リテストの信頼性は、同じ被験者に同じような環境で複数回テストを実施し、各回のテストのスコアを統計的に比較することで評価されます。 これにより、測定器の信頼性を示すことができます。 並行形式信頼性(または代替形式信頼性)は、テスト・リテスト信頼性と似ていますが、オリジナルの機器の異なる形式を次のテストで参加者に与えるという点が異なります。 測定器が安定性を示すためには、参加者がテストを完了するたびに、スコアの間に高い相関関係がなければなりません。 一般的には、相関係数が0.3未満であれば弱い相関、0.3-0.5であれば中程度、0.5以上であれば強い相関とされています4
同等性は、評価者間の信頼性によって評価されます。 このテストには、2人以上の観察者の間の一致の度合いを定性的に判断するプロセスが含まれます。 評価者間信頼性を評価するプロセスの良い例として、スケート競技会の審査員のスコアがあります。 スケート競技の参加者につけられたスコアが、すべての審査員の間でどの程度一貫しているかが、評価者間信頼性の指標となります。 研究の例では、研究者が機器の各項目の関連性に点数をつけるように求められます。
研究において、信頼性と妥当性の問題がどれだけ厳密に扱われているかを判断することは、研究の批評に不可欠な要素であると同時に、研究結果を看護実践に導入するかどうかの判断にも影響します。 量的研究では、研究に使用されたツールや機器の有効性と信頼性を評価することで、厳密さが決定されます。 質の高い研究では、これらすべての要素にどのように対処したかを示す証拠が得られます。 これは、研究の妥当性と信頼性を評価し、その結果を自分の臨床分野に適用すべきかどうかを判断するのに役立ちます。