идентифицировать sh.) Хотя каждый говорящий и становится слушателем через короткий промежуток времени, человеческое лицемерие сочтет неразумным зависеть от предусмотрительности и предупредительности говорящего. Вместо этого единый, зачастую произвольный набор фонологических правил, одни из которых усиливают, другие — редуцируют звуки, усваиваются каждым членом языкового сообщества в детстве при овладении тем или иным местным диалектом.

Фонологические правила помогают слушающим и тогда, когда им не нужно подчеркивать какую-либо акустическую разницу. Поскольку эти правила делают модели речи предсказуемыми, они сообщают языку избыточность. Подсчитано, что английский текст в два-четыре раза длиннее, чем он должен был бы быть, исходя из содержащейся в нем информации. Например, на моем компьютерном диске эта книга занимает около 900 000 знаков, но программа сжатия файла может воспользоваться избыточностью в последовательностях букв и сжать эту книгу до 400 000 знаков; те компьютерные файлы, которые не содержат английского текста, не могут даже отчасти рассчитывать на такое сжатие. Ученый-логик Квай так объясняет причины, по которым во многих системах заложена избыточность:

Это диктуемый здравомыслием избыток при имеющемся необходимом минимуме. Именно поэтому хороший мост не рассыпается на куски, когда ему приходится выдерживать нагрузку больше предусмотренной. Это страховка от провалов. Именно поэтому мы используем столько слов, чтобы отправить почту в тот или иной город и страну, несмотря на почтовый код. Одна неразборчиво написанная цифра в коде может все испортить… Легенда рассказывает как королевство погибло потому, что в кузнице не было гвоздя, чтобы подковать коня. Избыточность — эта страж, предохраняющий от такой чрезвычайной ситуации.

Благодаря избыточности в языке вх мхжхтх пхнхть, чтх х пхшх, дхжх хслх х зхмхнх всх глхснхх нх «х» (сл в н знт, гд стт глсн, т бдт нмнг трдн)[90]. При понимании речи избыточность, обеспечиваемая фонологическими правилами, может компенсировать двусмысленность, вызванную звуковой волной. Например, слушающий может быть уверен, что «thisrip» это this rip, а не the srip, поскольку в английском сочетание согласных sr невозможно.

* * *

Так почему же нация, которая может запустить человека на Луну, не может сконструировать компьютер, который будет воспринимать диктовку? В соответствии с тем, что я до сих пор объяснял, каждая фонема должна иметь свидетельствующее о ней акустическое выражение: набор резонансов для гласных, вызывающая шум преграда для фрикативных, и последовательность «тишина — взрыв — переход» для смычных. Последовательности фонем обрабатываются предсказуемым образом идущими по порядку фонологическими правилами, результаты действия которых были бы, очевидно, сведены на нет, если бы правила применялись в обратном порядке.

Причина, по которой понимание речи вызывает такие трудности, в том, что на пути между мозгом и губами много раз можно поскользнуться. Нет двух совершенно одинаковых человеческих голосов, различаться будут и формы голосового тракта, формирующего звуки, и индивидуальная манера артикуляции. Фонемы также звучат очень по-разному, в зависимости от того, насколько они напряженные и как быстро их произносят; в быстрой речи многие просто проглатываются.

Но главная причина того, почему электронная стенографистка не ждет вашего вызова за дверью, связана с общим явлением, возникающим при управлении мускулатурой, и называемым коартикуляцией. Поставьте перед собой блюдце и на расстоянии около полуметра от нее — кофейную чашку. Теперь быстро дотроньтесь до блюдца и схватите чашку. Вы наверняка дотронулись до края блюдца, ближнего к чашке, а не ровно посредине. Ваши пальцы наверняка пришли в позицию, удобную для хватания, в то время, как рука двигалась по направлению к чашке, но прежде, чем достигла цели. Такой плавный переход от одного жеста к другому и накладывание жестов повсеместно встречаются при осуществлении моторных функций. Это экономит силы, необходимые для движения частей тела и уменьшает нагрузку на суставы. Язык и гортань не являются исключением. Когда мы намереваемся артикулировать фонему, наш язык не может немедленно занять требуемую позицию: это увесистый кусок мяса, которому нужно время, чтобы переместиться. Поэтому пока мы его перемещаем, наш мозг планирует траекторию, уже представляя себе следующее положение, совсем как в случае с блюдцем и чашкой. Изо всех возможных позиций в полости рта, которые могут определить фонему, мы помещаем язык в ту, при которой наибыстрейшим образом может быть артикулирована следующая фонема. Если фонемой, которую мы сейчас произносим, не задано, где в точности должен находиться орган речи, мы предугадываем, где он должен находиться для произнесения следующей фонемы, и помещаем его туда заранее. Большинство из нас находится в полном неведении об этих аккомодациях, пока к ним не привлекут внимания. Произнесите Cape Cod [ke?p k?d]. До сих пор вы наверняка не замечали, что корпус языка занимает разные позиции для произнесения этих двух звуков k. В слове horseshoe [h???-?u?] первое s становится sh, при произнесении NPR n становится m, в словах month и width место образования звуков n и d — возле зубов, а не у края десен, как обычно.

Поскольку звуковые волны мгновенно реагируют на форму полостей, по которым они проходят, то коартикуляция сеет смуту среди звуков речи. Индивидуальная звуковая реализация той или иной фонемы «подкрашена» теми фонемами, которые идут перед ней и после нее, иногда до такой степени, что эта звуковая реализация не имеет ничего общего с фонемой благодаря компании других фонем. Вот почему невозможно отрезать кусок пленки с записью звучащего слова cat и надеяться найти в нем относящуюся к началу часть, которая содержала бы один звук k. Чем ближе и ближе к началу будут эти отрезки, их звучание будет варьироваться от чего-то, напоминающего ka, до чириканья или свиста. Такое «смазывание» фонем в речи могло бы в принципе иметь преимущество для оптимально сконструированного опознавателя речи. Согласные и гласные реализуются в речи синхронно, значительно увеличивая количество фонем, произносимых в секунду, как было замечено в начале этой главы, и существует много избыточных звуковых подсказок о том, что за фонема имеется в виду. Но этим преимуществом может воспользоваться только высоко технологичный распознаватель речи, тот, что имеет некоторое представление о принципах смешения звуков речевым аппаратом.

Конечно, человеческий мозг — это высоко технологичный распознаватель речи, однако, никто не знает, как ему удается быть таковым. Поэтому психологи, изучающие восприятие речи, и инженеры, конструирующие механизмы для распознавания речи, пристально наблюдают за работой друг друга. Возможно, распознавание речи — настолько сложный процесс, что существует всего несколько способов того, как оно в принципе может быть реализовано. Если так, то способ, которым пользуется мозг, может подсказать, как наилучшим образом сконструировать машину для распознавания речи, а способ, каким это удастся сделать машине, может предложить гипотезу о том, как это удается мозгу.

* * *

Уже на ранних этапах истории исследований речи стало ясно, что слушающие способны с выгодой для себя использовать свои представления о речевых намерениях говорящего. Последние сужают круг вариантов, возможных при акустическом анализе речевых сигналов. Мы уже заметили, что фонологические правила обеспечивают один вид избыточности, который можно использовать, но люди в состоянии пойти еще дальше. Психолог Джордж Миллер проиграл записи предложений, произносимых на фоне шума, и попросил людей в точности повторить, что они слышали. Некоторые предложения соответствовали правилам английского синтаксиса и имели смысл:

Furry wildcats fight furious battles ‘Пушистые дикие кошки ведут яростные бои’.

Respectable jewelers give accurate appraisals ‘Уважаемые ювелиры высказывают сдержанное одобрение’.

Lighted sigarrets create smoky fumes ‘Облегченные сигареты создают клубы

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату