Надійність психологічного тесту

Надійністю називається один з критеріїв якості тіста, його стійкість по відношенню до похибок вимірювання. Розрізняють два види надійність - надійність як стійкість і надійність як внутрішню узгодженість.

Надійність як стійкість

Стійкість результатів тесту - можливість отримання однакових результатів у випробуваних в різних випадках.

Стійкість визначається з допомогою повторного тестування (ретест):

У даному методі пропонується провести кілька вимірів з деяким проміжком часу (від тижня до року) одним і тим же тестом. Якщо кореляція між результатами різних вимірів буде високою, отже, тест досить надійний. Однак надійність не всіх тестів можна перевіряти цим методом, так як оцінюється якість, явище чи ефект можуть бути самі по собі нестабільні (наприклад, наш настрій, яке може змінюватися від одного виміру до наступного). Ще один недолік МР - це ефект звикання. Випробовувані вже знайомі з цим тестом, а може бути, навіть пам'ятають велику частину своїх відповідей після попереднього заповнення.

Надійність як внутрішня узгодженість

Внутрішня узгодженість визначається зв'язком кожного конкретного елемента тесту із загальним результатом, тим, наскільки кожен елемент входить в суперечність з іншими, наскільки кожен окремий питання вимірює ознака, на який спрямований весь тест.

Для перевірки внутрішньої узгодженості застосовуються:

Метод розщеплення або метод автономних частин
Метод еквівалентних бланків
Альфа Кронбаха

Метод розщеплення (Split-half reliability)

Цей метод полягає в розщепленні/розділення тіста на дві рівні частини (наприклад, парні і непарні питання, перша та друга половина), а потім знаходиться кореляція між ними. Якщо кореляція висока, тест можна вважати надійним.

Метод еквівалентних бланків

МЕБ полягає в застосуванні двох порівнянних один з одним форм тесту для великої вибірки (наприклад, форми L і M для вимірювання в шкалі інтелекту Стенфорд-Біне)

Результати, отримані при виконанні двох форм, порівнюють і вираховують кореляцію. Якщо коефіцієнт кореляції високий, отже, тест надійний. Недолік цього методу в тому, що він має на увазі такий тривалий і трудомісткий процес, як створення двох еквівалентних форм.

Альфа Кронбаха

У цьому методі, запропонованому Чи Кронбахом, порівнюється розкид кожного елемента з загальним розкидом всієї шкали. Якщо розкид результатів тесту менше, ніж розкид результатів для кожного окремого питання, отже, кожен окремий питання спрямований на дослідження одного і того ж ознаки, властивості чи явища. Вони виробляють значення, яке можна вважати істинним. Якщо таке значення не можна виробити, тобто виходить випадковий розкид при відповіді на питання, тест не надійний і коефіцієнт альфа Кронбаха буде дорівнює 0. Якщо ж всі питання вимірюють один і той самий ознака, то тест надійний і коефіцієнт альфа Кронбаха в цьому випадку буде дорівнює 1.

Крім надійності тестів, є також надійність спостереження - межнаблюдательская надійність. МН - це відсоток збігу результатів спостереження експертів один з одним.

Надійність і валідність

Надійність показує, що результати проведеного дослідження близькі до істини, а валідність показує, що результати дійсно відносяться до того явища, яке вивчається дослідником. Валидное дослідження автоматично є надійним, проте зворотне слідство не обов'язково. Надійне дослідження може і не бути валідним.