Кореляційне дослідження
Кореляційний аналіз - метод обробки статистичних даних, що полягає у вивченні коефіцієнтів (кореляції) між перемінними. При цьому порівнюються коефіцієнти кореляції між однією парою або множиною пар ознак, для встановлення між ними статистичних взаємозв'язків.
Загальна інформація
Мета кореляційного аналізу - забезпечити отримання деякої інформації про однієї змінної з допомогою іншої змінної. У випадках коли можливе досягнення мети, кажуть, що змінні корелюють. В самому загальному вигляді прийняття гіпотези про наявність кореляції означає, що зміна значення змінної А, відбудеться одночасно з пропорційним зміною значення Б: якщо обидві змінні зростають то кореляція позитивна, якщо одна змінна збільшується, а друга зменшується кореляція негативна.
Обмеження
1. Застосування можливе у випадку наявності достатньої кількості випадків для вивчення: для конкретного виду коефіцієнта кореляції становить від 25 до 100 пар спостережень.
2. Друге обмеження, що випливає з гіпотези кореляційного аналізу (див. вище), в яку закладена лінійна залежність змінних. У багатьох випадках, коли достовірно відомо, що залежність існує кореляційний аналіз може не дати результатів просто через те, що залежність не лінійна (виражена, наприклад у вигляді параболи).
3. Сам по собі факт кореляційної залежності не дає підстави стверджувати, яка з змінних передує або є причиною змін, або що змінні взагалі причинно пов'язані між собою, наприклад через дії третього фактора. (див. Хибна кореляція, нижче).
Область застосування
Даний метод обробки статистичних даних вельми популярний у соціальних науках (зокрема психології), хоча сфера застосування коефіцієнтів кореляції обширна: контроль якості промислової продукції, металознавство, агрохімія та ін.
Популярність методу обумовлена двома моментами: коефіцієнти кореляції відносно прості в підрахунку, їх застосування не вимагає спеціальної математичної підготовки. У поєднанні з простотою інтерпретації, простота застосування коефіцієнта призвела до його широкого поширення в сфері аналізу статистичних даних.
Хибна кореляція
Часто, приваблива простота кореляційного дослідження підштовхує дослідника робити помилкові інтуїтивні висновки про наявність причинно-наслідкового зв'язку між парами ознак, в той час як коефіцієнти кореляції встановлюють лише статистичні взаємозв'язки.
Ілюстрацією цього служить добре відомий анекдот: якщо вийти на вулицю і виміряти у 1000 випадкових перехожих розмір взуття і IQ, між ними буде виявлена статистично значуща кореляція. Однак це не означає, що розмір ноги впливає на інтелект, так як на наявність цього взаємозв'язку швидше за все вплинули такі фактори, як стать та вік учасників дослідження.
У сучасної кількісної методології соціальних наук, фактично стався відмова від спроб встановити причинно-наслідкові зв'язки між спостережуваними змінними емпіричними методами. Тому коли дослідники в соціальних науках кажуть про встановлення взаємозв'язків між досліджуваними змінними, мають на увазі або загальнотеоретичне допущення, або статистичну залежність.