‘Вот идет девушка, больная колитом. [Девушка с калейдоскопическими глазами.]’
‘Отче наш и иже с ним на небеси, Харольд будет их имя… Не приведи нас на станцию Пенн. [Отче наш, иже еси на небеси, да святится имя твое… Не введи нас во искушение.]’
‘Он выжимает сок из винограда там, где гроздья упаковываются и хранятся. [… хранятся гроздья гнева.]’
‘Радостно косоглазый медведь. [С радостью я понесу крест.]’
‘Я никогда не буду твоей подгоревшей пиццей. [… твоей тяжелой ношей]’
‘Это радостная дюна, и ты думаешь, что утонешь в ней. [Здесь полдюйма воды…]’
«Мондегрины» интересны тем, что послышавшиеся слова, как правило,
Об этом же свидетельствует и история искусственных распознавателей речи. В 1970-х гг. группа исследователей искусственного интеллекта при университете Карнеги-Меллон, возглавляемая Раджем Редди, создала компьютерную программу под названием HEARSAY, которая использовала голосовые команды, чтобы перемещать шахматные фигуры. Находясь под влиянием теории восприятия речи «сверху — вниз», они создали эту программу как «содружество» «экспертных» субпрограмм, действующих сообща с целью дать наиболее вероятную интерпретацию сигнала. Там были субпрограммы, специализирующиеся на акустическом анализе, на фонологии, на синтаксисе, на лексике, на правилах перемещения шахматных фигур, даже на шахматной стратегии применительно к развитию игры. Рассказывают, что на демонстрацию программы явился генерал из министерства обороны, спонсировавшего исследования. Пока ученые обливались холодным потом, генерала усадили напротив шахматной доски и микрофона, соединенного с компьютером. Генерал откашлялся. Программа напечатала: «Пешка — король 4».
Недавно созданная программа DragonDictate, упомянутая ранее в этой главе, делает больший упор на акустический, фонологический и лексический анализ, и, похоже, что этим объясняется ее больший успех. В программе имеется словарь, где слова представлены так же как последовательности фонем. Чтобы помочь предвидеть результаты действия фонологических правил и коартикуляции, в программе задано, как звучит каждая английская фонема в окружении любых возможных предшествующих и последующих фонем. Для каждого слова эти сопутствующие фонемы объединены в цепочку и при каждом переходе от одной звучащей единицы к другой заложена вероятностная характеристика. Цепочка выполняет функции среднестатистической модели говорящего человека, и когда эту систему использует реальный говорящий, вероятностные характеристики в цепочке варьируются таким образом, чтобы приспособиться к манере речи данного человека. Самому слову также присваивается процент вероятности, зависящий от его частотности в языке и от привычек говорящего. В некоторых версиях программы значение вероятности для слова варьируется в зависимости от того, какое слово ему предшествует; это единственный вид информации «сверху—вниз», используемый программой. Все вышеупомянутое позволяет программе вычислить, какое слово с наибольшей вероятностью произнес говорящий, исходя из имеющихся звуковых данных. Но даже при этом DragonDictate больше полагается на ожидания, чем нормально слышащий человек. Когда я присутствовал при демонстрации программы, ее пришлось упрашивать отличить слово
Теперь, когда вы знаете, как продуцируются единицы речи, как они представлены в ментальном словаре, как они перестраиваются и обрабатываются прежде, чем появиться из наших губ, в конце этой главы вас ждет награда: вы узнаете, почему английское правописание не столь ненормально, как кажется на первый взгляд.
Конечно, на английское правописание можно пожаловаться за то, что оно якобы отражает звуки слов, но не делает этого в действительности. В жанре шутливых стихов этот факт обыгрывается с незапамятных времен, примером чему служат следующие вирши: