Поэтому они устанавливаются в направлении от цели к субъекту, т. е. в порядке, обратном ходу действия, по так называемому «градиенту цели» [61]. Этот градиент в некотором отношении представляет собой парадоксальное явление: чтобы достичь цели, нужно каждый раз пройти весь путь от начала до конца, а закрепляется этот путь по отдельным отрезкам, начиная от конца к началу! Почему начальные отрезки пути не запоминаются по меньшей мере так же, как его завершающие части? Тем более что первые требуют большего ориентировочного напряжения, чем те, что расположены ближе к цели.
Видимо, запоминание пути определяется не только частотой его прохождения и величиной прилагаемых усилий, но в первую очередь ясностью отношения его частей к цели и, следовательно, необходимостью ориентироваться на каждом микроотрезке ситуации на его отношение к ближайшей цели [62]. В начале научения, когда промежуточные цели еще не намечены, такой ближайшей целью является только основная, конечная, с которой поэтому и начинается процесс выделения пути. В целенаправленном действии основная цель есть первое и очевидно значимое среди прочих объектов поля, которые выделяются и запоминаются лишь по мере увязки с нею.
Даже у животных цепь промежуточных ориентиров и действий может быть очень длинной, но она обязательно должна заканчиваться основным подкреплением, «конечной целью», иначе промежуточные цели теряютсвое вторичное, производное от нее значение. Этим объясняется тот факт, что образование условных рефлексов второго порядка без подкрепления первого оказывается трудным и нестойким [63]. Между тем, цепи условных рефлексов, которые завершаются «настоящим подкреплением», могут быть очень длинными (Б. Ф. Скиннер, А. В. Напалков). Подкрепление должно быть значащим, а не условным, а условный раздражитель (именно условный) сам по себе является индифферентным и никаким устойчивым значением, даже ориентировочным, не обладает; образование условной связи на одном ориентировочном подкреплении требует поддерживать ориентировочные раздражители «живыми», все время в какой-то мере «новыми», т. е. безусловными, а не условными, хотя и «чисто ориентировочными раздражителями». Условные рефлексы опираются на связь между подкреплением и тем, что ему систематически предшествует, предупреждает о нем, ведет к нему. И естественно, что эта связь намечается не от начальных отрезков и ориентиров пути, а от последнего, явственно увязанного с целью и поэтому в обратном порядке — «от конца к началу».
Этому на первый взгляд противоречит «метод гуманной дрессировки» животных, который в конце прошлого и начале нашего века открыл В. Л. Дуров [64], а значительно позже, уже в 30-е годы переоткрыл Б. Скиннер [65] (В. Skinner). Этот метод заключается в формировании сложной цепи условных рефлексов «от начала к концу», т. е. в порядке, обратном тому, о котором мы только что говорили. Но это противоречие мнимое. При научении от начала к концу экспериментатор делит весь путь на ряд последовательных шагов, из которых первый сначала получает самостоятельное и вполне «деловое» подкрепление. Переход ко второму шагу (а от него — к следующему и т. д.) намечается не самим животным, а экспериментатором — он держит новую порцию приманки так, что, следуя за нею, животное вслед за предыдущим делает очередной шаг, который тут же получает еще одно, тоже «деловое» подкрепление. В таком порядке подкрепление дается и после третьего шага, потом — после четвертого и т. д. При анализе такого метода воспитания цепи условных рефлексов приходится различать: как задача выгладит для экспериментатора и как она выступает для животного. Для экспериментатора она выгладит как движение от начала к концу, т. е. к цели, которую он наметил заранее. А для животного выступает только очередная цель, которая постепенно все дальше отодвигается по линии уже освоенных шагов.
Таким образом, и в этом случае для обоих участников опыта путь открывается «от цели к началу» (движения), только для экспериментатора такой целью представляется «конечная цель», а для животного — ближайшая, которая в следующий раз становится промежуточной. Действительный механизм остается одним и тем же: от того смыслового значения, которое имеет предмет потребности, к его ориентировочному значению (по его положению среди других вещей проблемной ситуации) и к ориентировочному значению тех промежуточных вещей, что расположены между субъектом и целью.
Благодаря соотнесениям в плане образа сначала выделяется конечная цель, а затем и промежуточные цели, и предметы на пути к завершающему подкреплению становятся ориентирами, так сказать, ориентировочными раздражителями. Если это происходит однократно, то ориентировочное значение объекта угасает после выполнения действия. Если в том же ориентировочном качестве эти объекты выступают повторно, то они превращаются в условные раздражители и по мере их закрепления процесс автоматизируется. Но различия в прочности условного значения — явление вторичное, основной же процесс — образование этого значения — в обоих случаях остается одним и тем же: выделение связи между тем, что уже имеет значение, и тем, что по времени или по ходу действия ему предшествует. Эта объективная связь выявляется и приобретает значение благодаря ориентировочно-исследовательской деятельности и вначале сохраняется только в процессе этой деятельности, являясь опорой для соотнесения в плане образа.
До сих пор мы пользовались ситуациями, в которых «заданный результат» — «потребное будущее» — (оба термина Н. А. Бернштейна) составляет предмет какой-нибудь «деловой» потребности; в этих ситуациях даже «чисто ориентировочное подкрепление» устанавливается лишь относительно «деловою» подкрепления и опирается на его силу. Но уже в жизни животных ориентировочная деятельность приобретает настолько большое значение, что выделяется в значительной мере в самостоятельную и весьма характерную деятельность. На это неоднократно указывал И. П. Павлов [66]. В этих случаях «заданным результатом», целью ориентировочно-исследовательской деятельности становится не достижение какого-нибудь определенного объекта или положения и ознакомление с ним. Этот процесс хорошо показан у П. Кроукфорта в описании первого ознакомления мыши с новым местом своего обитания: «Когда клетка с Артуром была открыта, произошло то, что происходило за тем со всеми последующими мышами, безразлично были ли они самцами или самками. Уже через несколько секунд Артур медленно выполз на пол, пробежал несколько шагов и точно тем же путем возвратился в клетку. Там он тотчас повернулся и опять побежал тем же путем, но на этот раз немного дальше. В результате он очутился возле стены. Пройдя вдоль нее несколько шагов, он повернулся и прежним путем возвратился к клетке. Последовали новые вылазки, которые становились все более и более дерзкими, так что через пятнадцать минут Артур уже бегал по всему периметру комнаты и начинал понемногу срезать углы. Затем наступил момент, когда он расстался с теперь уже знакомой стеной и приступил к исследованию неведомых внутренних областей. На каждом этапе своих исследований он «поддерживал связь» с клеткой. Позже я установил, что стоило мне во время этой фазы исследования нарочно илинечаянно произнести легкий шум, как мышь немедленно кидалась к клетке, доказывая, что она все время имела четкое представление о том, где именно находится ее убежище. Известно, что в подошвах мышиных лапок находятся железы, выделяющие жироподобные вещества, и, вероятно, они-то и дают мыши возможность с помощью обоняния точно возвращаться по собственному следу, когда у нее есть на это время. Известно также, что, убегая к убежищу, мышь полагается на свое кинестетическое чувство, на… память о всей последовательности мышечных движений. Час спустя Артур доказал, что в его голове уже хранится точный топографический план комнаты: теперь он возвращался к клетке напрямик через неисследованные участки. Когда же я бесшумно поднял клетку к себе, он пришел в большое волнение и принялся бегать по комнате, неизменно возвращаясь к тому месту, где прежде стояла клетка, которую он, по-видимому, пытался отыскать. Затем, он оставил эти поиски и продолжал исследование комнаты» [67].
Какое значение имеет такое знакомство с обстановкой, свидетельствует другое наблюдение того же автора: «Я впустил в комнату двух самцов… и увидел, как один из них замер, а потом начал агрессивные наскоки на другого, но тот каждый раз уходил и продолжал исследования. Однако в манере его ухода чувствовалось тонкое отличие. Создавалось впечатление, что этот самец рассматривает атаки своего конкурента как докучливую помеху, а не как повод для тревоги. Агрессивная мышь была настолько поглощена присутствием второй мыши, что она только иделала, что бегала за ней, а исследования почти прекратила. Через два часа исследователь кончил знакомиться с помещением. И тут его поведение резко изменилось. Он перестал убегать и начал драться. Вскоре он доказал свое превосходство в силе — а может быть, в решимости, — бывший преследователь превратился в преследуемого. Его положение оказалось