Оперантне обумовлення за Скіннера

Для розуміння сутності закону ефекту Торндайка нам необхідно дати чітке визначення поняття «ймовірність реакції». Це дуже важливе поняття, але, на жаль, дуже важкий. При обговоренні поведінки людини ми часто апелюємо до тенденцій «прихильності» вести себе певним чином. Майже в кожній теорії поведінки використовуються такі терміни, як «потенціал збудження», «сила звички» або «детерминирующая тенденція». Але як ми спостерігаємо тенденцію? І як можна її виміряти?

Якби певна поведінка існувало в двох іпостасях - в одному випадку воно завжди би мало місце, а в іншому - ніколи, то ми опинилися майже в безпорадному стані при введенні програми функціонального аналізу. Феномен, що має характеристики «все і нічого», має лише прості форми опису. Набагато більш продуктивним є припущення, що ймовірність здійснення реакції послідовно розподіляється між цими двома полюсами «нічого». Тоді ми можемо розглянути змінні, які на відміну від стимулів породження (eliciting stimulus), «не будучи причиною такої поведінки», роблять його наступ більш імовірним. Далі ми можемо, наприклад, розглянути наслідки дії кількох таких змінних.

Поширені вирази, що відображають імовірнісну природу явища, - «тенденція» або «схильність» - характеризують частоту настання певних видів поведінки. Ми ніколи не спостерігаємо ймовірність. Ми говоримо, що хтось «обожнює брідж», тому що помічаємо, що він часто грає в бридж і часто говорить про нього. «Глибоко цікавитися музикою означає багато грати, часто слухати музику і багато говорити про музику. «Невиправний гравець» багато грає в карти. Любитель кінозйомок робить знімки, виявляє їх і милується своїми власними знімками і знімками інших людей і т. д..

Характеризуючи поведінку людини з точки зору його частоти, ми приймаємо певні стандартні умови: він повинен бути здатний виконати і повторити певну дію, при цьому інші види поведінки не повинні заважати. Наприклад, ми не можемо знати, наскільки сильна тяга людини до музики, якщо йому доводиться також займатися іншими речами. Підійшовши до проблеми уточнення наукового визначення ймовірності, ми виявляємо, що вихідними моментами є частота і умови, при яких спостерігається те або інша поведінка. Ми усуваємо або принаймні зберігаємо в незмінному вигляді будь-яка умова, яке сприяє прояву конкуруючого з досліджуваним нами видом поведінки. Тварина поміщається в окремий (quiet) ящик, і за його поведінкою спостерігають за допомогою одноканального екрану, або воно реєструється за допомогою спеціальних технічних пристроїв. Ці умови можна розглядати як вакуумну середу, так як тварина буде реагувати на властивості ящика багатьма способами, однак його поведінка поступово досягне досить стійкого рівня, на якому можна досліджувати частоту заданої реакції.

Для вивчення процесу, який Торндайк назвав зніманням, ми повинні мати його «наслідок». Це може бути, наприклад, пред'явлення їжі голодному тварині. Ми можемо пред'являти нашому випробуваному їжу в зручному для нього місці, на великому підносі, з допомогою спеціального пристрою. При першому пред'явленні підноса тварина, ймовірно, буде реагувати на нього різними поведінковими реакціями, які заважають прояву досліджуваного нами поведінки. Поступово після декількох годувань воно без зволікання приймає їжу і ми отримуємо можливість розглядати це наслідок як залежне від поведінки і спостерігати його результат.

Ми вибираємо відносно простий вид поведінки, який вільно і багаторазово відтворюється і який легко піддається спостереженню і реєстрації. Наприклад, якщо піддослідним є голуб, то їм голови вище певного рівня є зручним поведінкою для вивчення. Воно може бути зафіксовано поглядом експериментатора на шкалі, прикріпленою до задньої стінки ящика, на тлі якої знаходиться голуб. Спочатку ми вивчаємо природну висоту підняття голови голубом і вибираємо позначку на шкалі, яка досягається ним лише в окремих випадках. Фіксуючи свій погляд на шкалі, експериментатор починає дуже швидко відкривати піднос, як тільки голова піднімається вище цієї лінії. Якщо експеримент проводиться у відповідності зі специфікаціями, то виходить один і той же результат: ми спостерігаємо швидке зміна частоти перетину головою голуба заданої лінії. Ми також бачимо, що голова голуба піднімається на більш високий рівень, і цей факт має велике теоретичне значення. Ми можемо дуже швидко змусити голуба високо піднімати голову, встановивши час пред'явлення їжі. Через одну-дві хвилини поза голуба змінюється таким чином, що його голова рідко опускається нижче лінії, яку ми обрали спочатку.

Коли ми демонструємо процес фіксації в такий відносно простій формі, ми бачимо, що деякі звичайні інтерпретації експерименту Торндайка надлишкові. Вираз «научіння шляхом проб і помилок», яке часто пов'язується із законом ефекту, тут явно недоречно. Ми вкладаємо особливий сенс у наші спостереження, коли називаємо будь-яке підняття голови «пробій», і немає підстав вважати «помилковим» будь-який рух, яке не призводить до встановленого нами результату. Навіть вживання терміна «научіння» вводить в оману. Твердження, що «птах навчається отримувати їжу за допомогою витягування шиї», є неадекватним виразом того, що відбувається. Говорити, що вона придбала «навичка» витягати шию - значить просто звертатися до пояснювальними вимислів, оскільки єдиним доказом наявності навику є набута тенденція виконувати дію. Найпростішим можливим описом даного процесу є наступне: ми робимо даний контингент наслідків залежним від певних фізичних властивостей поведінки (підняття голови), далі фіксуємо, що частота появи цієї поведінки зростає. Прийнято розглядати будь-який рух живої істоти як реакцію. Це слово запозичене з досліджень, присвячених вивченню рефлексів. Воно означає дію, яка настає у відповідь на попереднє подія - стимул. Але ми можемо зробити подія залежним від поведінки без визначення попереднього стимулу. Ми не змінюємо середовище проживання голуба для того, щоб викликати підняття голови. Ймовірно, можна показати, що будь-який простий стимул незмінно передує цьому руху. Така поведінка може опинитися під контролем стимулів, але при цьому відсутні відносини по типу «одне породжує інше», тому термін «реакція» не цілком адекватний, але він настільки вкоренився, що далі ми будемо його використовувати.

Звичайно, не можна передбачити і проконтролювати реакцію, яка вже відбулася. Можна лише передбачити, що схожі реакції будуть спостерігатися в майбутньому. Тому одиницею науки про прогнозуванні є не реакція, а клас реакцій. Для його опису буде використовуватися слово «оперантный». Цей термін показує, що поведінка «впливає» (operates) на середу, генеруючи наслідки. Слідства визначають властивості, за якими встановлюється подібність реакцій. Він буде використовуватися і як прикметник (оперантне поводження), і як іменник, що позначає поведінка, визначену цим наслідком.

Підняття голубом голови один раз в певний момент є реакцією. Це минуле і його можна розглядати з усіх точок зору, які представляють для нас інтерес. Поведінка, зване «підняттям голови», яке відбувається незалежно від певних обставин (instances), є оперантным. Його можна описати не як завершену дію, а як склад дій, який визначається властивостями висоти, на яку потрібно підняти голову. У цьому сенсі оперант можна визначити за допомогою слідства, що характеризується з допомогою фізичних термінів. «Підняття голови» («cutoff») на певну висоту є частиною (property) поведінки.

Традиційне вживання терміна «научіння» може бути збережено для опису перерозподілу реакцій на класи в складній ситуації. Термінологія, необхідна для опису процесу фіксації, може бути запозичена з теорії умовних рефлексів В. П. Павлова. Сам Павлов називає всі події, які посилюють поведінка «підкріпленням» і всі виникаючі в зв'язку з ним зміни, «зумовленням». Однак в експериментах Павлова підкріплення поєднується зі стимулом, а при оперантном поведінці воно залежить від реакції. Тому оперантне підкріплення є спеціальним процесом і потребує спеціального аналізу. В обох випадках посилення поведінки, відбувається в результаті підкріплення, називається «зумовленням». При оперантном обумовлення ми підсилюємо оперант, щоб збільшити ймовірність або частоту появи реакції. В умовах павловського, або «респондентного», обумовлення ми просто підвищуємо величину реакції, викликану умовним стимулом, і скорочуємо час між стимулом і реакцією. Ми вже відзначали, що цими двома випадками вичерпуються можливості: 1) організм обумовлюється, коли підкріплення супроводжує інший стимул або 2) слід за поведінкою організму. Будь-яка подія, яке не призводить до одному з цих випадків, не впливає на зміну ймовірності реакції. Тоді в експерименті з голубом їжа є тим, що підкріплює, а її пред'явлення, коли реакція «виділяється», є підкріпленням. Оперант визначається властивостями, від яких залежить підкріплення - висотою, на яку повинна підніматися голова голуба. Зміна частоти підняття голови на цю висоту є процес оперантного обумовлення.

Перебуваючи в стані неспання, ми постійно впливаємо на середу, і багато наслідки нашої поведінки мають силу підкріплення. За допомогою оперантного обумовлення середовище конструює базисний репертуар поведінки, завдяки якому ми зберігаємо рівновагу, ходимо, граємо в спортивні ігри, користуємося інструментами, говоримо, пишемо, гребемо, керують автомобілем і літаком. Ми можемо виявитися не готовими до зміни в середовищі, наприклад появи нового автомобіля, нового друга, нових інтересів, до зміни роботи та місця проживання, але ми зазвичай швидко пристосовуємося до нової обстановці, купуючи нові реакції і втрачаючи старі. Оперантне підкріплення не тільки структурує репертуар поведінки. Воно покращує продуктивність поведінки і ще довгий час зберігає його після того, як його засвоєння або продуктивність втрачають свою значимість.