Тестування

Сторінка: < 1 2 3 4 5 > цілком

Джерело: coolreferat.com

4. Втрата індивідуального підходу, "репродуктивність"

Тести знань апелюють, насамперед, до стандартного застосування готових знань. Відсутність можливості розкрити свою індивідуальність при наявності стандартних, заданих відповідей - нічим не восполнимый недолік методу тестів. З точки зору виявлення творчого потенціалу більшість тестів досить обмежені саме тим, що вони не апелюють до творчої, конструктивної діяльності. У всякому разі, окремі стандартизовані творчі тести мають справу з досить абстрактним матеріалом, а тести досягнень (знань), адаптовані на життєво важливому матеріалі (професійно релевантному), як правило, виконані у формі стандартного набору завдань з заданим відповіддю.

5. Відсутність довірчої обстановки

Бездушний і формалізований характер процедури тестування, звичайно, обертається тим, що випробуваний позбавляється відчуття того, що психолог зацікавлений в ньому особисто, в тому, щоб допомогти йому. Діалогічні методи (бесіда, гра тощо) у цьому плані мають безсумнівні переваги: безпосередньо спілкуючись з випробуваним, кваліфікований психолог може встановити довірчий контакт, проявити персональну участь, створити атмосферу, яка знімає напругу і захист.

6. Втрата індивідуального підходу, неадекватна складність

Іноді некваліфіковані "експертитестологи" виливають на дитину тести занадто складні, складні для його віку. У нього ще не склалися необхідні поняття і понятійні навички, щоб адекватно осмислити як загальну інструкцію до тесту, так і сенс окремих питань. Ми вже говорили про драматичних казуси різкої недооцінки розумового розвитку дітей при застосуванні вербальних тестів. Але багато "невербальні" тести також вимагають розвитку мовного мислення хоча б для осмислення того, що говорить дорослий у своїй інструкції. Альтернатива "дорослому" тестування в дитячій психології - ігровий підхід до тестування, коли тест включається в контекст гри, і дитина виконує його як би граючи.

Таким чином, тести не можна робити єдиним вичерпним методом діагностики (і освітньо-професійної і особистої). Вони вимагають паралельного використання вільних письмових робіт (особистісної діагностики місце творів займають проективні тести з вільним відповіддю), а також усної співбесіди (інтерв'ю). Тобто місце тестів - доповнювати зазначені вище традиційні методи. У цій якості тести незамінні, оскільки не мають багатьох недоліків, властивих традиційним методам.

Спокійне раціональне усвідомлення переваг і недоліків методу тестування звільняє всіх (виконавців, замовників, випробовуваних) як від надмірних сподівань на метод тестів, так і від зневаги до нього.

Найкраща гарантія від профанів і профанації - серйозний і кваліфікований інтерес до того, яку експериментально-наукову роботу зробили розробники тесту, як повно ця робота і її результати відображені в супутньої документації. Це насамперед питання надійності, витривалості і репрезентативності.

Надійність тесту

Надійність - одна з трьох головних психометричних властивостей будь-вимірювальної психодіагностичної методики (тесту). Надійність - це стійкість тіста, незалежність результатів від дії різних випадкових факторів. До числа таких факторів слід віднести:

  • різноманітність зовнішніх матеріальних умов тестування, які змінюються від одного випробуваного до іншого (час доби, освітленість, температура в приміщенні, наявність сторонніх звуків, відволікаючих увагу тощо);
  • динамічні внутрішні фактори, які по-різному діють на різних випробуваних в ході тестування (час так званої "вырабатываемости" - виходу на стабільні показники темпу і точності дій після початку тестування, швидкість стомлення тощо);
  • інформаційно-соціальні обставини (різна динаміка у встановленні контакту з психологом або лаборантом, проводять тестування; можливу наявність інших людей в приміщенні; наявність попереднього досвіду знайомства з даним тестом; наявність якогось знання і ставлення до тестів тощо).

Різноманітність і мінливість усіх цих чинників так великі, що вони зумовлюють появу у кожного випробуваного непрогнозованого за розмірами й напрямку відхилення - виміряного тестового бала від істинного тестового бала (який можна було б у принципі отримувати в ідеальних умовах). Середня відносна величина цього відхилення визначається як "стандартна помилка вимірювання" (Se). Величина помилки вимірювання вказує на рівень неточності або ненадійності тестової шкали (спеціально підкреслимо, що в психометричної теорії надійність і точність виявляються синонімами).

Помилка вимірювання (Se) і надійність вимірювання (R), згідно загальноприйнятої психометричної теорії, пов'язані наступною формулою:

R= 1 - S e2/ S x2, (1)

де Sх - дисперсія тестових показників Х.

Формула (1) є суто теоретичною, і на її основі не можна визначити ступінь надійності тесту, так як величина Se виявляється також невідомою величиною. Тому на практиці застосовують кореляційні методи. Найвідоміший з них - метод перетестирования (тест-ретест), або метод вимірювання ретестовой надійності. На одній і тій же вибірці випробуваних (не менше 30 осіб, які беруть участь у пілотажному психометрическом експериментальному дослідженні) проводять перше тестування Х, а потім повторне тестування Y. Інтервал, як правило, - два тижні, що гарантує забування запитань тесту.

де SX, SY - стандартні відхилення Х і Y;

Cov (x, y) - коваріація двох змінних Х і Y.

У цій книзі ми не ставимо за мету навчити студентів-педагогів кореляційним методів і намагаємося викласти лише принципову суть справи. Зацікавлені знайдуть всі необхідні обчислювальні формули та приклади в будь-якому підручнику по статистиці, а також у спеціалізованих виданнях з психодіагностики і психометрике ("Загальна психодіагностика", 1987; Клейн, 1994).

Що важливо для суті теорії надійності тестів, так це можливість визначити помилку вимірювання після того, як підрахована кореляція "тест-ретест" за формулою (3), отриманої шляхом простого перетворення формули (1):

Se = Sх Ч V1 - R. (3)

Таким чином, якщо стандартне відхилення в тесті склало 10 очок (середнє відхилення, яке в середньому допускають випробовувані від середнього балу для вибірки), а кореляція "тест-ретест" виявилася рівною лише 1,5, то помилка вимірювання виявляється дуже великий:

Se=10ЧV1-0,5»7,1. (4)

Тобто виявляється, що помилка вимірювання перекриває більшу частину розкиду тестових показників, так як справжній бал по тесту може відхилятися від виміряного бали аж на 7 очок! І якщо випробуваний набрав на 6 очок більше, ніж "середній" випробуваний, ми не можемо з достатньою впевненістю (статистичною достовірністю) говорити про те, що він істотно перевершив середнього випробуваного, так як це відхилення виявляється в межах стандартної похибки вимірювання.

Таким чином, низька кореляція результатів тесту між першим і повторним тестуванням говорить про те, що випадкові фактори суттєво спотворюють результати тесту. Це значить, що тест не володіє необхідною завадостійкістю і його не можна використовувати як вимірювальний інструмент.

Показник надійності R, який прийнято вважати досить високим, дорівнює або перевищує 0,95. Хоча в особистісних тестах часто користуються значно менш надійними тестами з показниками 0,8-0,9.

Метод вимірювання "ретестовой надійності" придатний лише для психічних властивостей, стабільних у часі. Надійність тестів на психічні стани і динамічні установки особистості не можна перевірити таким чином. В цьому випадку застосовують різні методи "розщеплення" тесту на окремі пункти, висвітлення яких виходить за межі цього посібника

Валідність тесту

Відповідність тесту вимірюваному психічному властивості називається валідність тесту. Це, без перебільшення, найважливіше психометричне властивість тесту. Якщо висока надійність тесту говорить нам про те, що тест справді "щось" вимірює, то висока валідність вказує на те, що тест вимірює саме те, що ми хочемо. Звичайно, на валідність тесту також негативно впливають випадкові фактори. Тому в психометрике прийнято наступне основне психометричне нерівність:

ВАЛІДНІСТЬ< НАДІЙНІСТЬ,

що означає, що валідність не може перевищувати надійності тесту.

Але на відміну від надійності, крім випадкових факторів, на валідність тесту впливають систематичні фактори. Вони привносять систематичні похибки в результати. Ці фактори є інші психічні властивості, які заважають проявитися в результатах тесту того властивості, на яке тест спрямований.

Наприклад, ми хочемо вимірювати "потенціал навченості" (найважливіший компонент загальних інтелектуальних здібностей людини), але даємо піддослідному тест з жорстким обмеженням часу виконання і відсутністю можливості повернутися і виправити допущену помилку. Цілком очевидно, що шукане психічне властивість виявляється змішаним у тесті з помилковим психічним властивістю - "стресостійкість": випробувані з високими показниками стресостійкості будуть краще виконувати тест. У цьому проявиться ефект систематичного спотворення.

У сучасній психометрике розроблені буквально десятки різноманітних теоретичних і експериментальних методів перевірки валідності тестів. Основним елементом практично всіх цих методів є так званий критерій валідності - це незалежний від тіста, зовнішній по відношенню до тесту джерело інформації про вимірюваному психічному властивості. Ми не можемо судити про валідності тесту до тих пір, поки не порівняти його результати з джерелом істинної (або хоча б свідомо більш валидной) інформації про вимірюваному властивості - з критерієм.

У наукових дослідженнях переважають спеціальні лабораторні критерії. Наприклад, конструюється компактний тест-опитувальник на тривожність. А в якості критерію валідності для нього використовується спеціальний трудомісткий об'єктивний лабораторний експеримент, в якому відтворюється реальна ситуація тривожності (випробуваним-добровольцям погрожують за помилкові дії ударами струму тощо).

На практиці дуже часто в якості критерію валідності використовуються прагматичні критерії - показники ефективності тієї діяльності, заради прогнозування якій здійснюється тестування. У школі самий типовий критеріальний показник - це успішність. Але для соціально-психологічної адаптації дитини зовнішнім критеріальним показником може бути рівень популярності в класі.

Дуже часто в якості критерію валідності використовується експертна оцінка. Наприклад, ми хочемо переконатися, що короткий тест на вимірювання рівня дисциплінованості валиден. Для цього опитуємо вчителів про рівень дисциплінованості добре відомих їм учнів. І після цього порівнюємо (коррелируем) результати тесту і експертний рейтинг учнів дисциплінованості.

Сторінка: < 1 2 3 4 5 > цілком