Элементы Элементы большой науки

Поставить закладку

Напишите нам

Карта сайта

Содержание
Энциклопедия
Новости науки
LHC
Картинка дня
Библиотека
Методология науки
Избранное
Публичные лекции
Лекции для школьников
Библиотека «Династии»
Интервью
Опубликовано полностью
В популярных журналах
Из Книжного клуба
Статьи наших друзей
Статьи лауреатов «Династии»
Выставка
Происхождение жизни
Видеотека
Книжный клуб
Задачи
Масштабы: времена
Детские вопросы
Плакаты
Научный календарь
Наука и право
ЖОБ
Наука в Рунете

Поиск

Подпишитесь на «Элементы»



ВКонтакте
в Твиттере
в Фейсбуке
на Youtube
в Instagram



Новости науки

 
10.03
Глобальное потепление создало экологическую ловушку для очковых пингвинов

09.03
При помощи вибрационных сигналов гусеницы зазывают товарищей и прогоняют конкурентов

06.03
Что общего у голых землекопов и «голых обезьян»?

03.03
Древние и продвинутые виды сосуществовали после глобального пермо-триасового вымирания

02.03
Выяснилось, как именно ацетилирование регулирует активность белка p53






Главная / Библиотека / Из Книжного клуба версия для печати

«Эволюция языка». Глава из книги

Уильям Текумсе Фитч


Эволюция языка

Уильям Текумсе ФИТЧ

Эволюция языка

(William Tecumseh Fitch. The Evolution of Language)

Введение в междисциплинарное изучение эволюции языка.


Часть третья. Эволюция речи
Глава 8. Эволюция вокального тракта

8.1. Речь — не язык, но важна для его понимания

Речь, которая представляет собой сложную артикулированную вокализацию, — это доминирующий способ сигнализации во всех человеческих культурах, за исключением тех случаев, когда эта модальность оказывается недейственной в результате морфологических нарушений, как, например, у глухих людей. Строго говоря, возможны и другие способы трансляции информации. Так, жестикуляция в жестовом языке признана полноценной сигнальной системой со своей грамматикой, и в этом смысле эквивалентна воплощению языка в речи (Stokoe 1960; Klima, Bellugi 1979). Другой пример трансляции языковых сообщений иными средствами, чем речь, дает письменность.

Первым делом необходимо провести четкое различие между речью и языком. Первая, как уже было сказано, — это сигнальная система, тогда как язык представляет собой систему выражения мыслей, которая может быть транслирована сигналами разных модальностей1. Во многих языках эти две системы обозначаются одним и тем же словом (пример — немецкое Sprache), что говорит о том, что два понятия не распознаются обыденным сознанием.

Говоря о том, что речь — это сложно артикулируемая вокализация, я имею в виду существование тонко организованной координации между гортанью и вокальным трактом, лежащим выше нее. Существуют и другие модусы артикулируемой вокализации, такие как лепет младенцев, глоссолалия или стиль скат в джазе и другие. Все эти примеры говорят о том, что сложно организованная вокализация не обязательно несет лингвистически значимую, осмысленную информацию. В этой главе будет рассмотрена биология речи и ее гипотетическая эволюция в двух аспектах: генерация речи и ее восприятие социальными партнерами.

Можно полагать, что речь всегда была главным способом обмена информации между людьми. Как пишет Стоко, трудно представить себе, чтобы популяция глухих людей могла бы достичь приемлемой численности, если бы такое сообщество сформировалось на заре эволюции человека (Stokoe 1960). Языковая способность в широком смысле теснейшим образом завязана на обмене речевыми сигналами, так что становление ее самой находилось в зависимости от речи. Многие авторы подчеркивают специфичность речи, как в плане ее генерации, так и восприятия, в качестве уникального компонента языка. И, наконец, веками принято считать, что речь есть то самое «недостающее звено», нехватка которого создает пропасть между коммуникацией животных и языком человека. Многие авторы обсуждали вопрос о том, насколько владение речью зависит от особенностей морфологии вокального тракта (Camper 1779; Darwin 1871; DuBrul 1958; Kelemen 1969; Lieberman et al. 1969; Lieberman 2007b). Сюда относятся самые старые гипотезы во всей проблеме эволюции языка. Ряд авторов полагают, что именно детали строения вокального тракта предопределили такие аспекты вербального поведения, как структура слогов, синтаксис и даже семантическую референтность (см., например, Lieberman 1984; Carstairs-McCarthy 1999).

Недавние обсуждения предполагаемого хода эволюции языка часто оказывались сфокусированными на речи, поскольку это единственная реальность, в отношении которой есть надежда воспользоваться палеонтологическим материалом в попытках реконструировать эволюцию анатомии вокального тракта (см., например, Donald 1991). С моей точки зрения, которая будет аргументирована в этой главе, эти надежды выглядят весьма сомнительными, поскольку едва ли возможно реконструировать строение вокального тракта, способность к речи и облик вымерших гоминид с необходимой степенью достоверности.

Я не настаиваю на этой точке зрения, но хочу подчеркнуть в этой связи главную идею моей книги. Столь многое предстоит еще узнать на основе эмпирических сравнительных исследований ныне существующих видов животных, что есть основания надеяться на будущие данные сравнительной физиологии как основы реального научного прогресса в обсуждаемой сфере. При этом я собираюсь показать, что многие вопросы основополагающего значения пока что остаются открытыми.

Последние достижения в понимании эволюции речи основываются на обширных новых данных относительно физических аспектов ее генерации. Дисциплины, занятые изучением речи — это, возможно, единственная область языкознания, где суть основополагающих феноменов может быть успешно анализируема и понята как результат последовательных циклов выдвижения гипотез и их эмпирической проверки, в том числе на уровне строгих математических методов физики. Исследователи, занятые вопросами эволюции речи, располагают достижениями целых поколений ученых, изучавших ее физиологические и акустические свойства. Тем самым возможно формулирование гипотез, имеющих твердое физическое обоснование. С этой точки зрения данные по эволюции речи — это не только ключевой аспект проблемы эволюции языка, но также хорошая иллюстрация сравнительного эмпирического подхода.

8.2. Генерация вокальных сигналов у позвоночных: основы биоакустики

Сравнительная анатомия вокального тракта была хорошо разработана уже к 1930-м годам (Gaupp 1904; Schneider 1964), но многое еще предстояло сделать до середины прошлого века (Chiba, Kajiyama 1941; Fant 1960; Titze 1994; Ladefoged 2001). Причиной некоторого замедления в развитии биоакустики стал тот факт, что анатомия была изучена прежде, чем пришло понимание принципов функционирования акустической системы. Старая литература преподносит нам описание тончайших деталей из области сравнительной анатомии, сочетающееся с неверными, устаревшими идеями относительно акустики как таковой. Результатом явилось то, что сегодня мы имеем три источника сведений, существенно изолированных друг от друга: именно, по анатомии звукопроизводящих систем, биоакустике и акустике речи. Работа по согласованию и унификации этих источников данных идет в настоящее время (см., например, Fitch, Hauser 2002; Fitch 2004b; 2006a). Без этого трудно было бы понять информацию, поступающую при изучении тех свидетельств, которые относительно эволюции речи может предоставить палеонтология.

Рис. 8.1. Строение вокального аппарата макака резуса («Эволюция языка»)

Рис. 8.1. Анатомия вокального аппарата млекопитающих. Строение вокального аппарата макака резуса иллюстрирует общие черты продуцирования звуков у млекопитающих и у человека, в том числе. Воздух из легких проходит через гортань и вызывает вибрацию голосовых связок, которые играют роль источника акустической энергии. Колебания воздушной струи в просвете канала порождают звук с меняющимися акустическими характеристиками

Генерация вокальных сигналов почти у всех тетрапод (амфибий, рептилий, птиц и млекопитающих) подчиняется единым принципам акустики. Общие черты анатомии звукопроизводящих систем показаны на рис. 8.1. Источником энергии для вокализации служит поток воздуха, поступающий из легких. Он преобразуется в вокальный сигнал за счет вибрации анатомических структур, которые оказываются на его пути. У человека, как и многих других позвоночных, это так называемые голосовые связки2. Темп их вибрации определяет основную (несущую) частоту звука, который, в зависимости от значения этого параметра может быть более или менее звонким, более или менее глухим. Струя воздуха, проходя через полости глотки, рта и носа, подвергается акустической фильтрации, в результате чего возникает дополнительный набор (second distinct set) частот, именуемых формантными частотами3. Формантная структура звука может контролироваться сокращениями мышц вокального тракта, в частности, челюстей, губ и языка. Вокальные сигналы всегда характеризуются множеством разных частотных характеристик, каждая из которых определяется своей причиной и потому может контролироваться более или менее независимо от других. Поэтому, говоря об акустических свойствах вокального сигнала, следует четко оговаривать, какая именно из частот имеется в виду, например, несущая частота, ее гармоники (характеризующие высоту звука) либо формантные частоты (характеризующие тембр звука). Рассмотрим отдельные звенья этого процесса более пристально.

8.2.1. Поток воздуха из легких

Наиболее простой случай вокализации имеет место при прохождении струи воздуха, поступающей из легких, через вокальный тракт. Из легких она выходит за счет уменьшения объема их полостей, в результате пассивного сокращения их эластических стенок. Такое движение струи воздуха есть естественный результат процесса дыхания и потому не требует никаких дополнительных энергетических затрат (Fitch, Hauser 2002). Человек может разговаривать целый день напролет, не затрачивая при этом дополнительной энергии (Moon, Lindblom 2003). Впрочем, заметных энергетических затрат может потребовать воспроизведение громких звуков (оперное пение, интенсивная вокализация лягушек и птиц).

Генерировать звуки можно и без участия легких в этом процессе, например, уменьшив давление воздуха в полости рта, за счет чего генерируется звук типа щелчка, либо чмокая губами. Довольно широко распространена в животном мире генерация звука «на вдохе». В таких звуках, как рев осла и громкое пыхтение (pant hoots) шимпанзе, задействованы оба механизма порождения звука — «на выдохе» и «на вдохе». Второй из них может функционировать в той или иной степени при криках младенца и в звуках, сопровождающих смех. Что касается генерации звука на вдохе в процессе речи, то это вполне возможно, но случается редко (примеры эпизодического использования дает слово «да» в шведском и французском языках).

8.2.2. Генерация голоса

Преобразование воздушной струи в вокальный сигнал происходит в голосообразующих структурах, у большинства позвоночных — в гортани. Простейший способ порождения звука основывается на преодолении воздушной струей препятствий в голосовом тракте, за счет чего возникает явление турбулентности4. Результатом является то, что мы воспринимаем как шум (звук с широкой полосой частот). В момент произнесения звука «с» возникает турбулентность струи воздуха близ кончика языка. При шепоте человека и шипении некоторых животных турбулентность имеет место при сужении просвета глотки. Шипение (широко распространенное, в частности, у рептилий) может оказаться наиболее древним и примитивным типом вокальных сигналов. Эволюционные преобразования в строении и функционировании гортани дали возможность становления более совершенных и широко распространенных типов голосообразования, именуемых фонацией.

При фонации струя воздуха приводит в движение эластичные голосовые связки гортани, что и служит причиной звуковых колебаний (рис. 9.3). У птиц глотка не участвует в порождении звуков, и эту роль выполняет сиринкс, или певчая гортань (Marler, Slabbekoorn 20045 ). У зубатых китов (дельфины, косатки, кашалоты) сформировалась особая система источников звуков, локализованная в носовой полости неподалеку от дыхал (Tyack, Miller 2002). Эти структуры могут иметь отношение к вопросу об эволюции звукоподражания у этих животных, о чем речь пойдет ниже. У человека порождение звуков обязано вибрации голосовых связок, так же как, например, у лягушек и аллигаторов.

Рис. 9.3. Генерация звуков у млекопитающих и птиц («Эволюция языка»)

Рис. 9.3. Генерация звуков у млекопитающих и птиц. У первых, как и у прочих наземных позвоночных, инструментом генерации звуков служит гортань. У птиц сформировался новый орган в основании трахеи, именуемый сиринксом, или певчей гортанью

Современные представления о физических аспектах и физиологии порождения звуков в гортани основываются на так называемой миоэластической6 и аэродинамической теории фонации (van den Berg 1958; Titze 1994). Ее первый базовый принцип состоит в том, что фонация — процесс пассивный в том смысле, что периодичность вибрации голосовых связок происходит вне нервного контроля (периодических же разрядов нейронов). В самом деле, нормальный процесс фонации возможен в гортани, изолированной от организма. В ответ на пропускание струи воздуха через голосовую щель — просвет между голосовыми связками, те станут вибрировать в том темпе, который отвечает таким их физическим характеристикам, как длина и степень натяжения.

В этом смысле роль нервного контроля над вокализацией ограничивается сигналами, меняющими положения самой гортани и ее голосовых связок: ширины голосовой щели, модификаций формы ее просвета и степени натяжения связок, что не затрагивает характера их вибрации как таковой7. Пассивная природа такого рода фонации допускает весьма высокий темп вибрации, недостижимый за счет намеренных усилий. Таковы ультразвуковые сигналы некоторых млекопитающих, в частности, рукокрылых и грызунов, с частотой между 20 и 100 кГц8, не воспринимаемые человеческим ухом (Zimmermann 1981; Holy, Guo 2005).

Как уже было сказано, помимо основной частоты колебаний (ОЧ) голосовых связок, имеющей минимальное значение, в вокальном сигнале обычно присутствуют дополнительные частоты — гармоники, или обертоны. Их значения выше такового ОЧ и кратны ему. Так, например, в голосе мужчины с ОЧ 100 Гц гармоники будут обладать частотами 200, 300, 400, ... Гц. Для высокого сопрано значения частот составят 1 кГц (ОЧ) с гармониками в зонах 2, 3, 4, ... кГц. Иными словами, частотные интервалы между соседними гармониками равны ОЧ. Зная, таким образом, частоту ОЧ, можно предсказать ее для всех гармоник, и наоборот. Как показывают работы по восприятию высоты тона звуков, слуховая система автоматически оценивает эту избыточную информацию, опознавая ОЧ, даже если она отсутствует в акустическом сигнале [«потерянная ОЧ» (missing fundamental); Moore 1988].

Степень звонкости (pitch) звука, как она воспринимается на слух, задается ОЧ вибрации голосовых связок, которая контролируется их длиной и силой натяжения. Это один из наиболее важных (salient) атрибутов звукового сигнала, важный для понимания речи и музыки (см., например, Ohala 1983a). Поскольку ОЧ зависит от длины и натяжения голосовых связок, наиболее низкие звуки возникают, если их длина значительна, а натяжение минимально. Поскольку у взрослых мужчин связки почти вдвое длиннее, чем у женщин, мужские голоса примерно вдвое ниже по тону (Titze 1989). (ОЧ мужских голосов составляет в среднем около 110 Гц, а женских около 200 Гц). Удлинение голосовых связок у мужчин наступает во время полового созревания под влиянием полового гормона тестостерона, оказываясь одним из компонентов так называемой «ломки голоса» (Kahane 1982; Harries et al1998). Характеристики мужских и женских голосов почти не перекрываются, это позволяет нам почти безошибочно определять пол говорящих взрослых людей по одному лишь голосу.

Столь ярко выраженный половой диморфизм в вокализации составляет характерную особенность человека. Этого мы не наблюдаем у многих животных, включая шимпанзе и большинство прочих приматов9. Таким образом, можно думать, что эта черта нашего поведения развилась в эволюции позже отделения гоминид от общего предка шимпанзе и человека. Поскольку голосовые связки у детей обоих полов имеют в целом одинаковую длину, а ее увеличение у мальчиков происходит только в период полового созревания, корреляция между высотой тона голоса и размеров тела у мужчин, вопреки ожиданию, отсутствует (van Dommelen 1993). Это противоречит широко распространенному мнению, согласно которому ОЧ должна служить показателем размеров тела (Morton 1977). Кажется довольно странным, что в экспериментах на восприятие голоса испытуемые ведут себя так, как если бы высота голоса и его формантная структура были в действительности показателями размеров тела говорящего (Fitch 1994; Smith et al2005). Такое неадекватное восприятие может быть признаком эволюционной инерции, или же побочным следствием навыков раннего развития.

8.2.3. Фильтры вокального тракта

Звук приобретает сложную физическую структуру (ОЧ и гармонические составляющие) в момент генерации, но при прохождении струи воздуха через отделы вокального тракта, лежащие выше гортани (глотка, ротовая и носовая полости), она обогащается новыми элементами. На этом этапе струя воздуха испытывает множество разнообразных колебаний самой различной частоты (в силу резонансных эффектов)10.

Каждая такая частота называется формантной, а паттерн вибрации струи воздуха как единого целого описывается функцией преобразования звука в вокальном тракте (vocal tract transfer function). Струя воздуха, вибрирующая в голосовом тракте, фильтрует сложный сигнал, идущий от источника звука, налагая на него формантные частоты. Каждую форманту можно считать «спектральным окошком», которое дает преимущество прохождению акустической энергии через него. Форманты действуют наподобие фильтров, пропуская некоторые частоты и блокируя другие. Как тип осветительного прибора в доме (свечи, неоновые лампы и др.) определяет, что мы видим снаружи через окна, так качество источника звука отражается в конечном сигнале на выходе. В нем интегрированы воедино свойства начального источника звука и результаты воздействия на него фильтрующей функции (рис. 8.2). Длина вокального тракта (путь прохождения звука от гортани до губ) — это единственный параметр, контролирующий характер формантных частот: чем больше длина, тем ниже формантные частоты. Этот факт имеет базовое значение в акустике и интересен с точки зрения выводов об информации, транслируемой в речи, о чем будет сказано далее в этой главе11.

Рис. 8.2. Принцип формирования формантной структуры речи («Эволюция языка»)

Рис. 8.2. Принцип формирования формантной структуры речи. F1, F2, F3 — форманты с разными частотными характеристиками. Объяснения в тексте*

Формантные частоты независимы от тех, что порождаются источником звука. Как я уже говорил, последние (ОЧ и ее гармоники) определяют высоту звука, тогда как форманты есть важный детерминант тембра голоса. При низких значениях формантных частот преобладает тембр баритона, при высоких — звук становится ярче и резче. Форманты являются одним из наиболее значимых характеристик речи. Если вы будете тянуть звуки нараспев звуки, соответствующие разным гласным (например, /i/, /a/, /o/, /u/), то сразу почувствуете различия в их формантных частотах.

Животные могут менять формантную структуру голоса, изменяя форму просвета вокального тракта. Так делает кошка, произнося свое «мяу», напоминающее по звучанию слово с гласными (Carterette et al. 1984). Более тонкие изменения формант могут быть вызваны такими действиями, как выпячивание губ, приводящее к некоторому удлинению вокального тракта, или втягивание их — с противоположным эффектом (Ohala 1984). Но даже при отсутствии подобного рода маневров, характеристики самого вокального тракта определяют формантную структуру звука. Что касается людей, то центральную роль в продукции речи играют форма, протяженность вокального тракта и изменения в топологии его просвета.

Мышцы и органы, за счет которых происходят эти изменения, называются артикуляторами вокального тракта. К ним относятся глотка, мягкое небо, язык, челюсти и губы. Многие из них стали отличительной особенностью млекопитающих и присутствуют у подавляющего большинства представителей этого класса позвоночных. Это говорит о том, что такие структуры, как, например, губы и мясистый язык, сформировались у предковых видов млекопитающих примерно 200 миллионов лет назад в качестве приспособления к питанию детенышей молоком матери (Wall, Smith 2001). Их работа тесно связана с рефлексом глотания, в котором задействованы около 25 мышц, контролируемых пятью разными краниальными нервами. Все эти механизмы готовы к функционированию у человеческого эмбриона уже на третьем месяце пребывания его в матке. Коль скоро глотание представляет собой базовую, исходную функцию вокального тракта, как в филогенезе, так и в онтогенезе, любые его преобразования в эволюции человека должны были накладывать ограничения на эту функцию. Таким образом, механизмы речи сформировались на морфологической основе этой нервно-мышечной системы (MacNeilage 1998b). Если вспомнить, что многие структуры полости рта ведут происхождение от жабр водных предков млекопитающих, легко видеть, сколь значительны были адаптивные преобразования, предшествовавшие началу эволюции вокального тракта человека.

8.2.4. Дифференциация функций при порождении и фильтрации звука в вокальном тракте

Все изложенное выше сформулировано в построениях, именуемых теорией порождения и фильтрации вокальных сигналов (source-filter theory of vocal production — Chiba, Kajiyama 1941; Fant 1960). Из нее следует, что человек в состоянии произносить каждую гласную с той или иной частотной окраской. Это простое заключение стало основой широко принятой модели продуцирования речи и пения у людей (Fant 1960; Lieberman, Blumstein 1988). Позже та же модель оказалась применимой к вокализации прочих позвоночных, включая разные виды земноводных, птиц и млекопитающих (Paulsen 1967; Fitch, Hauser 2002). Иными словами, был сделан вывод, согласно которому относительная независимость работы источника звука, с одной стороны, и механизмов его фильтрации — это явление, широко распространенное среди позвоночных.

Значение теории, о которой идет речь, наилучшим образом иллюстрируется рассмотрением широкого класса акустических систем, к которым она не применима. Таковы духовые музыкальные инструменты. Начну с того, что труба и кларнет структурно подобны вокальному тракту. В них есть источник звука (дудочка в кларнете, губы трубача), частота сокращений которого задает высоту тона производимого звука. Генерируемый звук затем проходит через воздух в полости инструмента. Этот столбик воздуха аналогичен вокальному тракту в том смысле, что содержит в себе несколько резонансных частот, подобных формантам, причем они определяются длиной самого воздушного столбика. Но здесь аналогия заканчивается, поскольку его частоты продолжают оказывать влияние на источник звука, контролируя темп его вибрации12. Можно сказать, что в духовом музыкальном инструменте источник звука и тракт его проведения двусторонне связаны (coupled), причем многие детали устройства инструмента способствуют такой связи и стабилизируют ее (Fletcher, Rossing 1991). В любом случае, звук, производимый духовым музыкальным инструментом, детерминирован системой в целом, так что частоты, порождаемые вибрацией источника звука и резонансом в полости инструмента не являются независимыми друг от друга.

Действительно ли подобная двусторонняя связь не свойственна вокализации животных? При нынешнем уровне наших знаний, совершенно недостаточном, у меня вызвал бы удивление факт отсутствия в животном мире видов, у которых вокализация не была бы построена по этому принципу13. Но если принять, что это явление редкое, в чем должна быть причина? Почему практически все духовые инструменты работают по такой схеме, а все вокальные системы животных построены по другой?

Одно из правдоподобных объяснений опирается на то, как устроена речь человека. В ней источник звука и его фильтры поставляют два различных типа информации, контролируемых независимым образом. При этом вокальный тракт оказывается относительно менее лабильным в своей работе (relatively flexible) по сравнению с гортанью. Если бы отсутствовал независимый контроль со стороны вышележащих отделов вокального тракта, имеющийся широкий спектр частот в звуках, генерируемых гортанью, оказался бы более ограниченным. Таким образом, теория порождения и фильтрации вокальных сигналов, применимая ко всем изученным к настоящему времени системам вокализации у животных, показывает, что принципы генерации речи основаны на общих акустических и анатомических закономерностях, имеющих древнюю эволюционную историю.

8.3. Перестройки вокального тракта человека

8.3.1. Странности в анатомии человека

Рис. 8.3. Анатомии вокального тракта орангутана, шимпанзе и человека («Эволюция языка»)

Рис. 8.3. Анатомии вокального тракта орангутана, шимпанзе и человека. С использованием магнитно-резонансной томографии показано опускание гортани и изменение формы языка, которые имели место в определенный момент эволюции гоминид. Высокое положение гортани и расположение плоского языка в полости рта, показанные у двух видов человекообразных обезьян, характерны для большинства млекопитающих. Белыми черточками показано положение гиоида, стрелками — воздушных мешков

В литературе по проблеме эволюции языка особое внимание было уделено вопросу об отличиях в расположении гортани у современного человека по сравнению с прочими млекопитающими (рис. 8.3). У большинства видов млекопитающих корень языка локализован ниже края нижней челюсти, так что сам язык лежит плоско на ее дне. Ниже корня языка располагается гортань, частично прикрытая сзади возвышающимся над ней надгортанником. Это шарнирно крепящийся хрящ, который в момент глотания твердой пищи перекрывает голосовую щель. Тем самым она предохраняется от попадания в нее посторонних частиц (см. рис. 8.1). В остальное время, когда животное дышит, надгортанник находится в контакте с мягким нёбом, тем самым предоставляя свободный проход между задней частью носовой полости и гортанью. Это обеспечивает нормальный процесс дыхания через нос и не препятствует поступлению слюны изо рта в пищевод, в обход гортани. Таким образом, дыхательный проход от ноздрей через гортань в легкие оказывается изолированным от пути прохождения пищи изо рта через пищевод в желудок. Этот механизм особенно важен для детенышей млекопитающих, что позволяет им сосать молоко и дышать одновременно (Wall, Smith 2001).

Человеческое дитя на пороге жизни ведет себя точно так же. У ребенка гортань расположена высоко, что оберегает его от опасности захлебнуться молоком матери. Но в возрасте около трех месяцев положение гортани начинает меняться в сторону ее опускания. К четырем годам она оказывается расположенной так низко по отношению к ротовой полости, что перемычка между дыхательным и пищевым трактами становится невозможной (Sasaki et al. 1977). У взрослого человека гортань располагается уже значительно ниже уровня твердого нёба, так что надгортанник уже не входит в контакт с мягким нёбом и потому не в состоянии выполнять роль передней стенки дыхательной трубки. Если взрослый человек вдохнет воздух в момент проглатывания пищи, он может подавиться, что иногда ведет к летальному исходу (Heimlich 1975).

Поскольку эта тема оказалась центральной во многих дискуссиях по эволюции языка (e. g. Laitman, Heimbuch 1982; Wind 1983; Lieberman 1984; Pinker 1994b; Carstairs-McCarthy 1999), рассмотренные особенности анатомии человека заслуживают специального рассмотрения. В период после отделения гоминид от общего предка шимпанзе и человека изменились и другие черты вокальной системы людей. Были утрачены гортанные воздушные мешки14, присутствующие у всех человекообразных обезьян, появился половой диморфизм в строении гортани (Fitch 2000b). Но в качестве наиболее существенного преобразования сегодня принято считать именно опускание гортани.

Сама идея, согласно которой особенности периферической анатомии могут препятствовать либо способствовать возможности пользоваться речью, весьма стара. Еще Аристотель, говоря об интеллекте дельфинов, утверждал, что их неспособность говорить проистекает из несовершенства анатомического строения: «Их язык малоподвижен, как и губы, что не дает возможности артикулировать издаваемые ими звуки» (Аристотель, 350 год до н. э.). В XVIII веке датский анатом Питер Кампер предположил, что орангутан лишен способности говорить из-за присутствия у него гортанных воздушных мешков (Camper 1779). Проблема была уточнена Яном Уиндом следующим образом: «Предположим, что вокальный тракт шимпанзе пересажен человеку, тогда как вся его нервная система оставлена интактной» (Wind 1976: 626). Задумаемся над тем, каковы могут быть речевые способности подобного гибрида.

Сам Уинд приходит к заключению, что такое существо будет мало отличаться от нормального человека, как полагал и Дарвин (Darwin 1871). Была высказана точка зрения, согласно которой именно строение вокального тракта современного человека предопределяет его способность к речи (Lieberman et al. 1972; Laitman, Reidenberg 1988). Эта позиция признана многими убедительной (например, Donald 1991; Pinker 1994b; Carstairs-McCarthy 1999). Сегодня мнения не столь едины, но большинство исследователей разделяют точку зрения, согласно которой шимпанзе не располагает достаточными фонетическими возможностями из-за особенностей периферической анатомии вокального тракта, и что этот вид был бы лишен речи даже при наличии нервного контроля на человеческом уровне. Разумеется, такие проблемы не решаются голосованием. Я вижу свою дальнейшую задачу в предоставлении читателю обзора имеющихся данных, чтобы он мог сформулировать собственное обоснованное мнение по данному вопросу.

Сам факт отличия вокального тракта человека по признаку расположения гортани от того, что мы видим у других млекопитающих, и шимпанзе в том числе, был известен давно (Symington 1885; Bowles 1889). До самого недавнего времени считали (Fitch, Reby 2001), что низкое расположение гортани присуще только нашему виду (см., например, Negus 1949; Wind 1970), по сей день остается доказанным тот факт, что в этом отношении человек уникален по крайней мере среди приматов. Со времен Дарвина принято считать, что такое положение гортани увеличивает шансы людей подавиться из-за попадания частиц пищи в голосовую щель (Darwin 1859).

Особенности анатомии, увеличивающие такую неблагоприятную возможность, должны были бы быстро устраняться естественным отбором, если бы не уравновешивались какими-либо селективно полезными преимуществами. К их числу до самого недавнего времени относили способность к речи. Была, в частности, выдвинута гипотеза, согласно которой низкое положение гортани увеличивает спектр фонетических возможностей человека (Lieberman et al1969). Иными словами, трансформацию вокального тракта в этом направлении долгое время считали бесспорной адаптацией к генерации речи и языка как такового. Эта точка зрения породила надежды пойти дальше по намеченному пути и реконструировать вокальный тракт вымерших гоминид, использовав для этого палеонтологические данные (Lieberman, Crelin 1971; Lieberman et al. 1972; Crelin 1987)15.

При очевидной скудости иных возможностей узнать что-либо о происхождении и эволюции языка работы Либермана привлекли к себе большое внимание и нашли широкое отражение в литературе по данной проблеме. При обсуждении этого подхода и полученных результатов необходимо разграничить два положения. Первое иллюстрирует бесспорный факт: в эволюции гоминид имело место изменение положения гортани. Второй вопрос состоит в том, каково значение этих анатомических преобразований в плане обеспечения способности к речи. Здесь позицию Либермана разделяют очень многие исследователи, хотя и не все без исключения (см., например, Boë et al. 2002). Я начну с обсуждения той роли, которую анатомия голосового аппарата играет в генерации речи с учетом современных сравнительных данных, а затем рассмотрю вопрос о реконструкциях ископаемого материала.

8.3.2. Значение низкого расположения гортани в генерации речи

Продувая воздух через трубку с просветом постоянного диаметра, мы получим звук с равномерно распределенными резонансными частотами, характер которых будет зависеть от длины трубки. Но любое изменение формы ее просвета будет менять формантную структуру. Это было показано при работе с первым синтезатором речи, сконструированным фон Кемпеленом в 1970 году (Dudley, Tarnoczy 1950). В нем вибрирующие язычки производили звук, богатый гармониками, но сам по себе он напоминал утиное кряканье. Этот сигнал направляли в эластичную резиновую трубку, которая имитировала вокальный тракт. Путем сжатия трубки Кемпелен по-разному менял ее форму, получая на выходе звуки, напоминавшие гласные речи16. Сходным образом мы во время разговора меняем форму полости рта движениями челюстей, губ и языка. Тем самым достигается эффект различного звучания гласных с разной формантной структурой. Это и есть то, что называется артикуляцией звуков речи. Разумеется, форманты, как физическая составляющая звука, присутствуют и в вокальных сигналах различных животных. Однако стремительные изменения формантной структуры — это отличительная особенность речи как системы вокализации, свойственной исключительно человеку.

Животные в состоянии менять характеристики вокального тракта во время вокализации, например, открывая и закрывая рот или меняя положение губ (Carterette et al1984; Hauser, Schön Ybarra 1994). Язык млекопитающих — орган достаточно подвижный, но в определенных пределах (Kier, Smith 1985). В частности, его длина не может изменяться путем быстрых сокращений мышц. Движения языка ограничиваются его перемещениями вверх и вниз, но это не меняет цилиндрическую форму просвета ротовой полости настолько, чтобы изменить формантную структуру издаваемых при этом звуков. При загибании кончика языка кверху это возможно лишь в небольшой степени (Carterette et al1984). Дополнительные возможности менять форму полости рта дает некоторая подвижность губ. Если бы все эти ограниченные в своей свободе движения находились под контролем человеческого мозга, здесь можно было бы ожидать звуков, подобных гласным и согласным, разнообразие которых оказалось бы значительно большим, чем в голосах млекопитающих. Но, по мнению Либермана и его коллег, при такой анатомии вокального тракта в любом случае немыслима генерация ключевых гласных /i, a, u/ (point vowels), которые максимально различаются по формантной структуре и, таким образом, лежат на линии, оконтуривающей все пространство возможностей гласных (Lieberman et al1969). Эти гласные универсальны в том смысле, что присутствуют во всех языках мира (Maddieson 1984).

Произнесение этих гласных требует кардинальных изменений формы просвета вокального тракта в передней части глотки и в ротовой полости (Carré et al1995). Они осуществляются за счет изменений формы и положения языка. В момент произнесения этих звуков корень языка отводится вниз, сужая тем самым верхний просвет глотки. При этом вниз движется и гортань. Просвет полости рта может расширяться или сужаться за счет движений самого языка вниз или вверх, соответственно. Так, он наиболее узок при произнесении /i/ и открывает свободную дорогу звуку /a/.

Всякий раз, когда корень языка движется вниз, он погружается глубже в глотку, отклоняя вниз и назад ее переднюю стенку. Изменение ширины просвета глотки создает, таким образом, еще одно поле вариативности, независимое от происходящего в полости рта. Перед нами система из двух взаимосвязанных трубок, каждая из которых способна плавно менять форму своей полости. Глоточная трубка широко открыта в момент произнесения /i/ и почти замкнута при звуке /a/. Такая система позволяет экстренно, стремительно изменять топологические характеристики канала, даже при небольших деформациях языка как такового17. Без этого произнесение ключевых гласных было бы невозможным (Lieberman et al. 1969; Carré et al1995).

Из всего сказанного можно сделать вывод, что в действительности критическим фактором в генерации речи оказывается скорее опускание подъязычной кости и корня языка, к которой он крепится, нежели гортани как таковой. Низкое положение гортани возможно и без опускания корня языка (как мы видим это у некоторых видов оленей — см. ниже) без каких либо последствий в плане увеличения фонетического потенциала. Поэтому при обсуждении эволюционных изменений вокального тракта человека было бы более правильно сосредоточить внимание на опускании подъязычной кости и корня языка. Это положение гипотезы Либермана надежно подтверждается эмпирическими данными. Посмотрим, что дает попытка рассмотреть его в применении к ископаемым гоминидам.

8.3.3. Анализ ископаемого материала

Основываясь на реконструкции палеонтологического материала, Либерман с соавторами считают, что опускание гортани в антропогенезе произошло очень поздно, уже у Homo sapiens. Более спорно их утверждение, согласно которому неандертальцы не обладали речью, подобной нашей. Но рассмотренные выше изменения вокального тракта не могли быть адаптивными для вида, который не регулировал формантную структуру издаваемых звуков. При отсутствии такого механизма не было бы почвы для последующих преобразований вокального тракта ради совершенствования системы. Поэтому Либерман с коллегами приходят к выводу, что гоминиды должны были обладать какой-то речью до того, как гортань начала опускаться. Этот пункт построений авторов зачастую не встречал понимания либо подвергался неверным толкованиям (Arensburg et al1990; Boë et al2002).

Первая статья на интересующую нас тему называлась «О речи неандертальца» (Lieberman, Crelin 1971), а в следующей сказано, что неандертальцы «были лишены хорошо развитого механизма вокализации, но... несомненно должны были владеть „языком“». То, что нам известно об их культуре, указывает на существование у них «лингвистических способностей» (Lieberman et al. 1972: 302). Сказанное поясняется в сноске на с. 305 этой статьи: «Заметьте, что существование некой формы языка есть необходимое предварительное условие для сохранения... изменений (mutations), подобных тем, что произошли в области глотки. Они повышают эффективность (rate) коммуникации, но неблагоприятны в отношении процессов глотания и дыхания». Как я попытаюсь показать ниже, факт преобразования формы вокального тракта без появления речи, обнаруженный у некоторых животных, снижает силу аргументов Либермана с соавторами. Но это не оправдывает неверных интерпретаций сделанных ими выводов. Либерман никогда не утверждал, что неандертальцы были лишены языковых способностей (Lieberman 2007b).

Остановимся на утверждениях, согласно которым речь неандертальцев «не кодировалась по слоговому принципу» (Lieberman et al. 1972: 302), что «их лингвистические способности допускали, в лучшем случае, коммуникацию медленного темпа, а в худшем случае — заметно меньшее владение синтаксисом и семантикой по сравнению с тем, на что способен современный человек». Вопрос о «слоговом кодировании» обсуждается Либерманом в одной из его более поздних работ в связи с проблемой восприятия речи (Lieberman 1984). Оно, как считает этот автор, столь же специфично для человека, как и порождение речи (Liberman 1996). Для речи характерна очень высокая скорость генерации фонем, а темп распознавания речи превосходит скорость восприятия любой другой быстрой последовательности звуков (Liberman et al1967). В ранних попытках сконструировать читающую машину для слепых использовали систему замены букв произвольно выбранными звуками типа жужжания и гудков18. Эти машины имели серьезные недостатки. При скорости чтения, приближающейся к темпу речи, все эти звуки сливались в сплошную какофонию. Если же текст проигрывали достаточно медленно для того, чтобы он был воспринимаем, обычная фраза тянулась так долго, что при достижении ее конца можно было забыть, с чего она начинается. После создания первого электронного синтезатора речи впервые стало ясно, что восприятие речи есть явление нетривиальное. Еще позже выяснилось, что высокая скорость передачи информации в речи обязана процессу «кодирования», при котором говорящий «кодирует» фонемы в слоги. Слушатель же декодирует слоги, снова переводя их в последовательности фонем. Результатом стало заключение, высказанное учеными из содружества Haskins Laboratories19, согласно которому генерация и восприятие речи, взятые вместе, преодолевают жесткие ограничения, налагаемые на процесс обмена речевыми сигналами нашей слуховой системой (за счет перекодирования фонем в слоги и обратно).

Те, кто скептически настроен в отношении построений Либермана, о которых речь шла выше, вправе сказать, что существуют тысячи слов в большинстве языков, где отсутствуют ключевые гласные и что, таким образом, вокальные тракты животных могли бы, в принципе, позволить им произносить такие слова. И далее, тот факт, что эти гласные есть во всех языках, еще не значит, что они определяли кардинальную линию развития речи в эволюции: они могут быть попросту побочным эффектом опускания глоточной порции вокального тракта, обязанного иным, независимым причинам. В ответ на это Либерман указал на особую функцию одной из этих гласных, именно /i/, которая иногда именуется «сверхгласной» (Nearey 1978). При ее произнесении язык занимает самое высокое положение в ротовой полости, препятствуя малейшей возможности турбулентности воздушной струи. Благодаря этому гласная /i/ наиболее однозначно опознается слушателями в тестах на восприятие речевых сигналов. Что еще важнее, по мнению Либермана, эта гласная играет центральную роль в процессе, при котором приемник речевого сигнала интуитивно оценивает размеры полостей, где рождается членораздельная речь отправителя сигнала (vocal tract normalization, по терминологии Либермана). Дело в том, что эти размеры широко варьируют в соответствии с вариациями общих размеров тела людей. Это значит, что лица разной комплекции в момент произнесения «одной и той же гласной» (при одинаковой топологии вокального тракта) в действительности продуцируют существенно разные звуки. И наоборот, два идентичных сигнала, произносимые разными персонами, могут быть восприняты в качестве различных (Ladefoged, Broadbent 1957; Fant 1975). Между тем гласная /i/, располагающаяся на самом краю пространства возможностей гласных, не подвержена такому ошибочному восприятию. На мой взгляд, этому звуку принадлежит главная роль в возможной оценке размеров звукопорождающих полостей и комплекции говорящего в целом (Fitch 1994). Как считает сам Либерман, эта супергласная играет центральную роль в восприятии речи современным человеком.

Следует сказать, что работы Либермана и его коллег способствовали замене фантазий относительно эволюции звукового языка серьезными, проверяемыми научными гипотезами и стали важным толчком к возрождению интереса к данной теме. Единственным их недостатком следует считать недостаточность сравнительного материала. В этих публикациях приводится некий предварительный анализ формантной структуры в вокализации приматов (Lieberman 1968)20, но слишком мало уделяется внимания вокальной продукции прочих млекопитающих. Теперь я перейду к этой теме, в разработке которой участвовал персонально.

8.4. Сравнительные данные:
I. Вокальная продукция млекопитающих

8.4.1. Перестройки вокального тракта млекопитающих

Практически все трактаты по анатомии вокального аппарата млекопитающих базируются на анализе музейных экземпляров (например, Bowles 1889; Negus 1929; Kelemen 1963). При этом предполагается, что анатомия мертвого животного может служить адекватным материалом для понимания функции исследуемых структур в действии, что не очевидно. В своих ранних исследованиях я применял рентгенокиносъемку, которая показала высокую степень динамичности вокального тракта млекопитающих.

В частности, оказалось, что у собак, например, положение гортани и корня языка существенно меняется во время вокализации (Fitch 2000c). Объектом первой успешной рентгенокиносъемки стал голосовой аппарат козленка, в момент его вокализации в ответ на проигрывание голоса матери. Во время сеансов спокойного дыхания через нос надгортанник животного стабильно оставался позади занавески, в полости носоглоточного дыхательного канала (Ibid.). Однако во время вокализации глотка сильно опустилась, занавеска полностью перекрыла проход в носовую полость, а блеющий звук исходил изо рта. Сразу же по окончании вокализации восстановился режим нормального дыхания через нос. Уже это стало своего рода неожиданностью, поскольку предполагалось, что животные не в состоянии использовать занавеску подобным образом (Lieberman 1984). Неожиданным оказались также быстрые координированные изменения конфигурации вокального тракта как раз в момент вокализации. Так что эта первая попытка принесла результаты, отличные от ожидаемых.

Однако истинной неожиданностью стали кадры съемки голосового аппарата лающей собаки (рис. 8.4). В режиме дыхания ее надгортанник, как и у козленка, оставался в контакте с занавеской. Но непосредственно перед началом лая гортань значительно смещается книзу (вероятно, под действием грудино-щитовидной мышцы, которая есть у всех млекопитающих), увлекая за собой корень языка. Как и в предыдущем случае, такое состояние органов сохранялось только во время вокализации. Иными словами, их расположение во время лая на редкость сходно с тем, что мы видим у человека (корень языка глубоко погружен в глотку). То же самое удалось показать в последующих исследованиях, проведенных на свиньях и обезьянах21. Отсюда следует, что у всех млекопитающих имеют место сходные изменения конфигурации голосового тракта во время вокализации.

Рис. 8.4. Динамика опускания гортани и гиоида во время вокализации («Эволюция языка»)

Рис. 8.4. Динамика опускания гортани и гиоида во время вокализации. Рентгеновские снимки иллюстрируют изменения положения гортани собаки при молчании и во время лая. Во втором случае гортань, гиоид и корень языка принимают положение, сходное с наблюдаемым у взрослого человека

Причина этого довольно очевидна: звук, проходящий через носовую полость, неизбежно был бы не столь интенсивным, как выходящий изо рта. У всех тех видов, о которых здесь шла речь, занавеска во время вокализации полностью прикрывает носовую полость сзади, препятствуя прохождение звука через нее. Оказалось, таким образом, что просвет голосового тракта не остается статичным. Положение гортани и корня языка претерпевают резкие изменения. Если говорить о собаках, то у них я обнаружил такое состояние вокального тракта при лае, которое напоминает сочетание двух сообщающихся трубок (см. 8.3.2), считавшееся уникальным для человека. Все это говорит о тщетности попыток реконструкции движений при артикуляции на основе анализа положения мышц у мертвого или анестезированного животного, как это сделано, в частности, в работе Либермана и Крилина, а также в некоторых других (Lieberman, Crelin 1971; Crelin 1987; Duchin 1990).

Очевидно, большинство млекопитающих способны менять топологию голосового аппарата во время вокализации. Это должно быть справедливо для шимпанзе, австралопитека и неандертальца. Иными словами, можно допустить, что самые первые гоминиды могли приводить свой вокальный тракт в такое состояние, которое позволило бы им четко произносить многие фонемы (рис. 8.5).

Рис. 8.5. Динамика изменений вокального тракта у вымерших гоминид («Эволюция языка»)

Рис. 8.5. Динамика изменений вокального тракта у вымерших гоминид

Принимая во внимание важность изложенных фактов для проблемы эволюции языка, нельзя не удивляться тому, что они были установлены лишь в самое последнее время. Изучение генерации речи с использованием рентгенокиносъемки стартовало 1930-х годах (Holbrook, Carmody 1937), и успешные результаты были получены уже к началу 1970-х годов (Perkell 1969). В середине 1960-х годов этим методом были зафиксированы первые акты дыхания новорожденного и его первый крик (Bosma, Lind 1965). Однако имеются лишь отдельные упоминания о применении этого метода к анализу вокализации млекопитающих (Arvola 1974; Laitman 1977). В известных мне публикациях ничего не сказано об описанных выше трансформациях голосового тракта. Единственная работа, где говорится о чем-то подобном, принадлежит Уайту, описавшему опускание глотки во время кукареканья у домашних петухов (White 1968). За все эти годы были написаны и опубликованы многочисленные статьи с рассуждениями о вокальном тракте гоминид, и ученые горячо спорили о том, каковы могли быть способности к речи у наших ископаемых предков. Но ничего не было сделано для того, чтобы изучить состояние вокального тракта при вокализации у самых обычных животных.

8.4.2. Устойчивое низкое положение гортани у млекопитающих

Комментируя данные, приведенные в 8.4.1, Филипп Либерман указал на то, что, в отличие от собаки и свиньи, у человека особенности конфигурации вокального тракта (такие, как низкое положение гортани) остаются постоянными. Они могут выполнять множественные функции при генерации речи. При фиксированном состоянии корня языка возможен контроль за произнесением звуков более точный, чем в случае свободной динамики просвета голосового тракта и изменений его длины (впрочем, у человека гортань тоже меняет свое положение при произнесении разных гласных (Fant 1960).

Таким образом, идея, согласно которой постоянное низкое положение гортани есть адаптация человека к речи, в глазах ее автора не была поколеблена нашими исследованиями. Вскоре, однако, я ознакомился с данными Дэвида Реби относительно строения вокального тракта у благородного оленя (Cervus elaphus) и трансформаций этих структур при вокализации. Просмотр видеокадров показал сходство происходящего с тем, что было ранее обнаружено у собак. Различие состояло в том, что гортань даже в состоянии покоя находилась очень низко (рис. 8.6). Дальнейшие исследования подтвердили, что у этого вида и у европейской лани (Dama dama) гортань занимает это положение постоянно, откуда следовало, что эта черта не является уникальной для человека. Как видно из приведенного рисунка, у самца во время рева гортань опускается так низко, что длина вокального тракта достигает одного метра. При этом частотные характеристики звука достигают очень низких значений (Fitch, Reby 2001).

Рис. 8.6. Низкое положение гортани у двух видов оленей («Эволюция языка»)

Рис. 8.6. Низкое положение гортани у двух видов оленей. Состояние, эквивалентное характерному для современного человека, но свойственное у оленей только взрослым самцам

Следует, однако, заметить, что корень языка сохраняет при вокализации фиксированное высокое положение, поскольку гиоид крепится достаточно прочно к костям черепа. В результате связь между системой гиоид — корень языка и гортанью весьма эластична, что не имеет ничего общего с тем, как эта система работает у человека.

Мной были получены и другие свидетельства низкого положения гортани у разных представителей животного мира. Например, у коала (Phascolarctos cinereus), австралийского сумчатого, гортань занимает постоянное низкое положение, как у оленей и у человека (об этом упоминается в ранней анатомической литературе; Sonntag 1921). Интересно, что этот автор в другой своей работе, посвященной сопоставлению анатомии вокального аппарата человека и человекообразных обезьян, не обратил внимание на то, что эти структуры у коала ближе к человеческим, чем у шимпанзе. Недавно было показано, что положение гортани у антилопы дзерен Procapra gutturosa очень напоминает таковое у оленя (Frey, Riede 2003). Японские приматологи установили, что у шимпанзе гортань слегка опускается в период полового созревания (Nishimura et al. 2003).

У всех крупных кошек, относящихся к роду Panthera (лев, тигр, леопард и ягуар), гортань также занимает постоянное низкое положение (Weissengruber et al. 2002). Но в отличие от того, что мы видели у оленей, она находится, как и у людей, в тесной связи с гиоидом, который при вокализации движется вниз вместе с гортанью (Owen 1835). Поскольку удлиненный, эластичный корень языка также опускается в момент произнесения звуков, вся вокальная анатомия этих животных выглядит очень похожей на человеческую.

8.4.3. Функция низко расположенной гортани: преувеличение своих размеров отправителем сигнала

Данные об устойчивом низком расположении гортани, приобретенном многими млекопитающими конвергентно22 и сходным с расположением ее у человека, оказываются загадочными с эволюционной точки зрения. Ни одному из перечисленных выше видов, естественно, не свойственна речь или даже хоть сколько-нибудь артикулируемая вокализация. Рев оленя или рычание тигра, хотя и производят сильное впечатление, — это сигналы акустически очень простые, лишенные быстро меняющейся, четко артикулируемой формантной структуры, типичной для речи людей. Таким образом, особенности вокального тракта этих животных должны выполнять какую-то иную функцию. Это следует принимать во внимание при обсуждении проблемы эволюции речи.

Возможны несколько гипотетических функций удлинения вокального тракта (см., например, Fitch 1999; Fitch, Reby 2001; Fitch, Hauser 2002). Интуитивная идея, согласно которой низкочастотные звуки имеют более широкое поле распространения, не применима к наземным животным, поскольку такие звуки гасятся за счет интерференции. Поэтому наиболее правдоподобной представляется гипотеза преувеличения своих размеров отправителем сигнала (size exaggeration hypothesis). Суть ее в том, что низкочастотные форманты, обязанные опусканию гортани при вокализации и, соответственно, удлинению вокального тракта, несут информацию о размерах тела животного. Эта гипотеза обоснована большим фактическим материалом (Fitch 2002).

Длина вокального тракта у большинства животных коррелирует с величиной черепа, которая, в свою очередь, определяется общими размерами тела. Таким образом, первый и последний показатели оказываются взаимосвязанными (Fitch 2000a). На этом основании можно считать, что характер формант должен быть надежным, правдивым (honest) индикатором размеров вокализирующей особи (см. гл. 4). Это допущение было эмпирически проверено и подтверждено на многих видах животных, включая собак, свиней и обезьян, а также на людях (Fitch 1997; Fitch, Giedd 1999; Riede, Fitch 1999; Vorperian et al. 2005). Известно также, что форманты обнаруживаются в видоспецифических вокальных сигналах разных животных (Rendall et al. 1998; Fitch, Kelley 2000; Hienz et al2004; Fitch, Fritz 2006).

Показано, что люди и олени пользуются этим механизмом при оценке размеров отправителя сигнала (Fitch 1994; Reby et al. 2005; Smith et al2005; Charlton et al. 200823 ). Отсюда я делаю заключение, что задолго до появления человека способность к распознаванию формант играла важную роль в коммуникации животных. Коль скоро форманты используются для оценки размеров отправителя сигнала, в эволюции прогрессировала потенциальная возможность индивидов манипулировать ею в своих интересах (Krebs, Dawkins 1984), в частности путем преувеличения своих размеров в транслируемой информации. Это дает несомненные адаптивные преимущества, повышающие эффективность звуковых территориальных сигналов в темноте и в густых зарослях24.

Животным доступны по крайней мере три способа снижения частотных характеристик формант, не являющихся взаимоисключающими: удлинение носовой полости, выпячивание вперед губ и опускание гортани. Из них последний допускает наибольшую свободу для изменения состояний и потому может предоставлять материал для последующих эволюционных трансформаций в ту или иную сторону. Тот факт, что у оленей и дзерена опущенная гортань свойственна лишь самцам, миновавшим подростковый возраст, согласуется с предположением о связи этого признака с территориальным поведением. Коль скоро более крупные самцы имеют более длинную шею, их звуковые сигналы, хотя и преувеличены (though exaggerated), остаются все же «честными» индикаторами их размера25 (Reby, McComb 2003). У крупных кошек, у которых и самцы и самки охраняют свои территории, особи обоих полов обладают сходным строением голосового тракта26. За пределами класса млекопитающих также встречаются особым образом устроенные голосовые аппараты, которые можно считать адаптациями того же рода (size-exaggerating). Таковы удлиненные трахеи у птиц и полые носовые гребни динозавров (Weishampel 1981; Fitch 1999). Таким образом, рассмотренная гипотеза (size exaggeration hypothesis) дает правдоподобное, с точки зрения теории и логики, объяснение рассмотренным преобразованиям вокального тракта у млекопитающих и совместима с многочисленными (wealth) данными.

Интересно, что принципы, положенные в основу этой гипотезы, применимы и к человеку. В самом деле, у людей, как и у оленей, гортань претерпевает дополнительное опускание при достижении половой зрелости, но у обоих видов это свойственно только самцам (Fitch, Giedd 1999; Lieberman et al. 2001). Это второй акустический компонент процесса ломки голоса, о котором я упоминал ранее, приводящий к тому, что формантные частоты у мужчин имеют более низкие значения, чем у женщин. После этого повторного опускания гортани у юношей не наблюдается какого-либо улучшения фонетических способностей, а девушки оказываются в этом отношении отчасти впереди свои сверстников-мужчин €(Hyde, Linn 1988; Henton 1992). Так что единственно логически оправданная функция таких преобразований — это преувеличение своих размеров отправителем сигнала (size exaggeration — Ohala 1984; Fitch, Giedd 1999). В этом отношении рассматриваемое явление выглядит как составная часть симптома, включающего в себя во время полового созревания мужчин также расширение плеч и появление бороды. Таким образом, перед нами надежное свидетельство (solid evidence), что опускание гортани функционирует, чтобы преувеличить размеры27, также как у оленей или львов, не воздействуя при этом на сферу речевой компетенции.

Все это важно по следующей причине. Раньше считали, что если у ископаемых гоминид будет обнаружена низко лежащая гортань, то это будет достоверным доводом их способности к речи. Теперь, когда выдвинута четкая (clear) альтернативная гипотеза — преувеличение размеров (size exaggeration), такое толкование становится неубедительным (invalid)28. Открытие австралопитека с низко расположенной гортанью не может быть доказательством владения им речью, коль скоро известно, что ею не обладают лев и коала. Предлагаемая здесь гипотеза состоит в следующем: у ранних гоминид (на предлингвистической стадии) опускание гортани произошло для преувеличения размеров (for purposes of size exaggeration)29, и это послужило преадаптацией к последующему приобретению речи.

Недавние исследования частотных характеристик формант у обезьяны колобуса (Colobus guereza) показали, что воздушные мешки дают альтернативную возможность (помимо вокального тракта) для снижения частотного спектра формант и тем самым для дезориентации (fakе)30 других относительно истинных размеров тела у отправителя сигнала (Harris et al. 2006). Какова бы ни была функция этих мешков, тот факт, что они есть у всех человекообразных обезьян, указывает на их присутствие у вида, предкового для шимпанзе и человека. Ясно поэтому, что эти образования были утрачены в ходе более поздней эволюции пралюдей. Недавняя находка подъязычной кости австралопитека, ясно свидетельствующая о том, что этот вид обладал воздушными мешками, подобным присутствующим у шимпанзе, говорит об утрате их на ранней стадии эволюции рода Homo (Alemseged et al2006; см. ниже). В любом случае, утрата этих структур людьми трудно объяснима и требует дальнейших исследований (см. Nishimura et al2007).

8.5. Сравнительные данные:
II. Что специфично в восприятии речи?

В главе 4 было показано, что у большинства животных явления генерации сигнала и его восприятия асимметричны в том смысле, что в первом случае возможности его отправителя весьма ограничены, а во втором адресат способен оценивать сообщения дифференцированно в силу существования социального контекста (Cheney, Seyfarth 2007). С этой точки зрения паритет между процессами порождения и восприятия речи — явление необычное, требующее объяснений эволюционного характера.

Выше было показано, что вокализация людей опирается на фундаментальные принципы генерации звука и поэтому имеет нечто общее с вокализацией прочих млекопитающих. А что можно сказать о восприятии речи? У человека сохраняются основные черты строения звуковоспринимающих систем млекопитающих: среднее ухо с тремя слуховыми косточками и кортиев орган, функция которого состоит в настройке восприятия на жизненно важные частоты и в преобразовании звуковых колебаний в нервные импульсы. Нервные структуры, проводящие эти сигналы в мозг, также высоко консервативны в пределах класса. Правда, появление фиксированной ушной раковины у приматов ведет к утрате некоторых стволовых структур, ведающих движением ушей в других группах. Таким образом, различия между человеком и прочими млекопитающими следует рассматривать на фоне общности основных морфофизиологических механизмов (Webster et al1992).

8.5.1. Чувствительность к частотным характеристикам звука

Очевидные различия в механизмах слуха среди млекопитающих затрагивают спектр воспринимаемых частот — признак, подверженный высокой изменчивости даже в группах близкородственных видов. Чувствительность к звукам с разными частотными характеристиками описывается аудиограммой. Она представляет собой график, в котором каждому значению частоты соответствует порог слышимости31. У человека частотный спектр воспринимаемых звуков находится в зоне от 20 Гц до 20 кГц (Zemlin 1968; Moore 1988). Нижележащие частоты называются инфразвуковыми. Их генерация и восприятие возможны у некоторых крупных млекопитающих (в частности, слонов и китов). Частоты выше 20 кГц относятся к категории ультразвуковых, доступных восприятию многих млекопитающих. Верхняя октава в спектре, используемом людьми, лежит в зоне от 10 до 20 кГц и не играет практически никакой роли в речи и музыке. Наиболее важная зона функционирования речи ограничена сравнительно узкими рамками от 100 до 5 кГц (зона, часто именуемая «пропускными свойствами телефона»). Иногда широкий пик наибольшей спектральной чувствительности относят к области частот около 3 кГц, где наблюдается более или менее хорошее совпадение с центром частного спектра речи. Основная причина такого соответствия лежит в характеристиках частотного резонанса ушного канала, сходных у человека и шимпанзе (Kojima 1990).

Обсуждались также достаточно любопытные различия между этими двумя видами (Elder 1934; Kojima 1990; Heffner 2004). В целом, шимпанзе более, чем люди, чувствительны к частотам свыше 8 кГц (Elder 1934) и немного менее — ниже 250 Гц. У некоторых особей шимпанзе зафиксирован «провал» в области вокруг 4 кГц. Поскольку в этом плане исследовали небольшое число особей, трудно представить себе, что столь небольшие межвидовые различия могли иметь серьезные следствия в восприятии речи. В самом деле, шимпанзе прекрасно воспринимают звуки в частотном диапазоне речевых сигналов и, пройдя соответствующую тренировку, могут понимать слова (Savage-Rumbaugh et al1993). Очень вероятно, что этот провал восприятия в области 4 кГц есть следствие нарушений в наиболее чувствительной зоне, вызванных воздействием сильного шума. То же самое обычно наблюдается у пациентов в клинике (McBride, Williams 2001). В целом можно сказать, что, по данным сравнительного аудиографического анализа, основные показатели слуховой чувствительности людей совпадают с тем, что мы находим у прочих млекопитающих с примерно такими же размерами тела (Heffner 2004). Это позволяет думать, что в трактовках эволюции речи экстраполяции на основе реконструкции слухового аппарата вымерших гоминид могут оказаться неубедительными (Martínez et al2004).

8.5.2. Категориальное восприятие

В главе 3 речь шла о явлении, именуемом категориальным восприятием. Суть его в том, что распознавание стимулов, относящихся к одной категории, происходит с гораздо большим трудом (вплоть до потери такой способности), чем самих категорий в целом. В отношении звуков речи категориальное восприятие выражается в том, что пары фонем, противопоставленных, скажем, по звонкости (например, п и б), различаются более четко, чем пары другого рода стимулов с таким же уровнем физического несходства. Когда суть явления стала понятна лингвистам, это явилось отправной точкой для дальнейших продуктивных исследований механизмов восприятия речи и основой гипотезы, согласно которой категориальное восприятие «специфично» для языка (Liberman 1957). Однако позже гипотеза, в ее первоначальной формулировке, была подвергнута критике. Во-первых, категориальное восприятие у людей обнаружилось в распознавании синтезированных музыкальных звуков внутри их континуума (Cutting, Rosner 1974). При повторении опытов, которые легли в основу этой работы, выяснилось, что не все было благополучно в экспериментальном дизайне (Rosen, Howell 1981). Однако последующие исследования подтвердили ее основные выводы (Cutting 1982). Таким образом, представления о том, что сфера категориального восприятия ограничена одной только речью, оказались поставленными под сомнение.

Гораздо важнее то, что свидетельства категориального восприятия были получены для животных при анализе их реакций как на речь (Kuhl, Miller 1975; 1978; Morse, Snowdon 1975; Kluender et al1987)32, так и на видоспецифическую вокализацию (Zoloth et al1979; Nelson, Marler 1989). Эти сравнительные исследования говорят о том, что выделение категорий и повышение чувствительности к сущностям, входящим в разные категории — это общее свойство восприятия звуков. Более того, у шиншилл33 обнаружили своеобразный модус распознавания согласных (Kuhl, Miller 1978), весьма напоминающий человеческий, вплоть до дифференциации таких тонких деталей, как сдвиги пиков артикуляции. Все это может служить свидетельством того, что механизм порождения звуков речи людей находится в соответствии с ранее существовавшими ограничениями в работе слуховой системы млекопитающих. Если здесь действовали какие-либо процессы коадаптации, то речь приспосабливалась к слуху, а не наоборот.

8.5.3. Другие аспекты восприятия речи, которые могут быть специфичными для языка

Сказанное, разумеется, не означает, что в восприятии речи человеком нет никаких истинных инноваций, уникальных для языка. Однако история представлений о категориальном восприятии заставляет насторожиться: не следует предполагать, что то или иное свойство носит такой уникальный характер, до тех пор пока не получены сравнительные данные по животным (Hauser, Fitch 2003; Fitch et al. 2005). Например, процесс, при котором приемник речевого сигнала интуитивно оценивает размеры речевого аппарата отправителя сигнала (vocal tract normalization), считался присущим исключительно людям. Однако в недавних исследованиях, рассмотренных выше (8.4.3), предлагается альтернативная точка зрения (Sommers et al1992; Rendall et al. 1998; Fitch, Kelley 2000; Hienz et al. 2004), которая наводит на мысль, что, как минимум, механизмы, лежащие в основе таких способностей, имеют длительную эволюционную историю (Fitch 1994; Lieberman 2000).

Пока что отсутствуют сравнительные исследования, касающиеся эффекта Мак-Гурка34 (McGurk, MacDonald 1976), сдвоенного восприятия (duplex perception; Whalen, Liberman 1987) и компенсирующих эффектов (trading relations; Repp 1982). Тысячи лабораторных опытов с использованием оперантного научения показали сопоставимость способностей к восприятию речи у животных с тем, что имеет место у человека (Sommers et al. 1992; Hienz et al. 2004), хотя на уровне, касающемся тонких деталей звуков, различия у людей и животных остаются существенными (с этим не вполне согласны авторы работ: Sinnott, Brown 1997; Sinnott, Saporita 2000). В качестве примера упомяну, что макака можно легко научить распознавать слоговые согласные, но детальный анализ характера их ошибок и генерализаций показал, что они руководствуются при этом иными, нежели люди, акустическими признаками звуков (Sinnott, Williamson 1999). Впрочем, и людям свойственна определенная изменчивость в восприятии (Schwartz, Tallal 1980; Tallal et al1996).

Специфический для человека механизм восприятия гласных был описан Патрицией Кул (Kuhl 1991; Kuhl et al. 1992), под названием эффект перцептивного магнита (perceptual magnet effect)35. Он имеет много общего с категориальным восприятием (некоторые считают, что эти два явления идентичны — Lotto et al. 1998). Этот эффект экспериментально продемонстрирован для детей и взрослых, но у макаков он определенно не обнаружен (Kuhl 1991). Здесь стоит упомянуть, что скворцы, натренированные на распознавание гласных, способны к спонтанной генерализации, весьма сходной с наблюдаемой у людей (Kluender et al. 1998). Так или иначе, необходимы дополнительные данные по широкому спектру видов, чтобы выяснить, насколько широко подобные явления распространены среди позвоночных, а также повторение опытов с макаками для проверки факта отсутствия у них эффекта перцептивного магнита.

Таким образом, сегодня мы не располагаем убедительными свидетельствами того, что существуют механизмы восприятия речи, адаптированные только лишь к восприятию ее звуков и уникальные для человека36. Надежным представляется предположение, согласно которому восприятие речи и механизмы ее обработки сознанием имеют много общего с тем, что известно для животных. Выявленные небольшие различия (fine differences) в этом плане между животными и людьми не выглядят в качестве главного тормоза к восприятию речи представителями животного мира и не достигают такого уровня, который мог бы воспрепятствовать появлению речи у ранних гоминид.

8.6. Выводы из сравнительных исследований

Я прихожу к заключению, что способность к восприятию звуков у млекопитающих вполне пригодна для восприятия речи и что анатомия их вокального тракта могла бы позволить им произносить множество разных (variety) различимых звуков, которых было бы достаточно для простой (basic) коммуникативной системы. Более того, анатомия тигра такова, что он мог бы произносить ключевые гласные /i/, /a/ и /u/. Перебирая возможные объяснения, почему млекопитающие не делают всего этого, я останавливаюсь на мысли, что этому препятствует скорее характер нервного контроля за работой вокального аппарата, нежели его морфология. В этом смысле высказанная идея перекликается с представлениями Дарвина, считавшего, что именно изменения в центральной нервной системе, а не ее периферическая анатомия стали причиной критических инноваций в эволюции речи (Darwin 1871).

Во-вторых, тот факт, что у некоторых млекопитающих гортань расположена низко, как и у людей, является доказательством того, что такое ее расположение может служить каким-либо иным функциям, нежели обеспечению возможности речи. Гипотеза преувеличения своих размеров отправителем сигнала, первоначально выдвинутая для объяснения этого явления у животных, оказалась применимой и к человеку, позволяя объяснить странный факт повторного опускания гортани при достижении половой зрелости только у мужчин. Это служит основанием для предположения, что у ранних гоминид опускание гортани было связано с функцией имитации отправителем сигнала своих более крупных, чем в реальности, а не со становлением речи, что послужило преадаптацией к последующему ее приобретению. Но значит ли это, что сегодня низко расположенная гортань не является адаптацией к речи?

Конечно нет. Гипотезы преувеличения размеров и специфичности опущенной гортани для речи независимы и взаимодополнительны. Если не понимать этого, легко спутать первоначальную функцию с используемой в настоящее время. Крылья летучей мыши сформировались не «для» полета, а на той стадии, когда предки этих животных еще передвигались на четырех конечностях. Преувеличение размеров (или, возможно, какая-то другая функция) могло создать предпосылку для дальнейшего опускания гортани, но не может быть ответственным за то, что мы видим у ребенка в возрасте трех месяцев (Fitch, Reby 2001; Fitch 2002).

Среди утверждений, содержащихся в палеоантропологической литературе, многие требуют проверки на основе сравнительных исследований. Например, считается, что дыхание человека через рот специфично для нашего вида, хотя у других животных (и у маленьких детей) оно осуществляется «исключительно» (obligatory) через нос (Rodenstein et al. 1985). Между тем многие млекопитающие дышат через рот в жаркую погоду, используя испарение влаги с языка для охлаждения тела (Schmidt-Nielsen et al. 1970). Далее, перекрывания заднего входа в носовую полость занавеской считали принадлежностью одного лишь человека, что было опровергнуто нашими наблюдениями за процессами глотания и вокализации (Fitch 2000c; Wall, Smith 2001).

Рассмотрим, наконец, такое явление, как риск подавиться, который связывают с опусканием гортани. Сама по себе мысль вполне правдоподобна. Но часто упоминаемая цифра в 3 тыс. летальных случаев в год по этой причине в США (Heimlich 1975) говорит об очень низком темпе смертности, вызванной этим фактором по сравнению с множеством других (Clegg, Aiello 2000). Так что тут требуются критические сопоставления со смертностью по этой причине у животных с их «нормальным» вокальным трактом. Известно, например, что ягнята иногда погибают, захлебнувшись молоком матери (Hight, Jury 1970), но какая-либо статистика на этот счет мне неизвестна. Таким образом, имеющиеся сегодня сравнительные данные — это лишь вершина айсберга, тогда как они могли бы дать немало новых идей об эволюции вокального тракта у гоминид.

8.7. О реконструкциях способности к речи у вымерших видов гоминид

Вскоре после того, как мысль о важном значении опускания гортани привлекла внимание палеоантропологов, были найдены ее подтверждения на ископаемом материале. Эти открытия породили ряд полезных гипотез и противоречия во мнениях, а также необходимость поисков других ископаемых останков такого рода (рис. 8.7).

Рис. 8.7. Параметры, создающие почву для реконструкции вокальных способностей вымерших гоминид («Эволюция языка»)

Рис. 8.7. Параметры, создающие почву для реконструкции вокальных способностей вымерших гоминид. Относительно величины мозга см. раздел 10.4

8.7.1. Скелетные компоненты в регионе вокального тракта

Сверху вокальный тракт ограничен основанием черепа. Это главная скелетная опора голосового тракта, поскольку большинство связанных с ним мышц и связок крепятся к основанию черепа и гиоиду. Структуры этого региона включают в себя ряд образований, истоки эволюции которых прослеживаются до древнейших челюстноротых позвоночных.

Основание черепа пронизано множеством отверстий, через которые проходят кровеносные сосуды и нервы. Через наиболее крупное из них (foramen magnum) проходит спинной мозг до слияния с головным. Отверстие окружено связками, подвижно соединяющими скелетный канал спинного мозга с костями черепа. Кость, через которую проходит большое затылочное отверстие и которая образует затылок, называется основной затылочной костью. Двигаясь от нее вперед, мы находим височную, клиновидную, обонятельную и носовую кости и, наконец, сошник, челюстную и предчелюстную кости, которые образуют твердое небо и верхнюю челюсть (см. рис. 8.7). Основание черепа человека не выглядит таким плоским, как у шимпанзе и прочих млекопитающих (Negus 1949; DuBrul 1958). Гиоидный аппарат предоставляет прочную костную основу для крепления мышц языка и ряда других, управляющих работой голосового тракта. Это несколько изогнутых хрящей, ведущих происхождение от образований, гомологичных жаберным дугам рыб (см. гл. 5). Гиоид соединяется с основанием черепа примерно таким же образом, как и нижняя челюсть. Строение верхней порции гиоидного аппарата (эпигиоид) чрезвычайно изменчиво от вида к виду. У некоторых крупных травоядных (таких как овцы и лошади) она массивна, напоминая челюстную кость, и надежно крепит корень языка к основанию черепа. У большинства хищных, грызунов и рукокрылых это цепочка небольших косточек, так что здесь крепление к черепу более эластично. Наконец, у приматов и крупных кошек это образование утратило костную основу, которая уступила место связкам и мышцам. Основой нижней порции гиоида (базигиоид), несущей главную функциональную нагрузку, служит базигиоидная кость, имеющая U-образную форму. Из-за того, что это образование полностью окостенело у человека, здесь именно его называют гиоидом. У приматов и крупных кошек это почти «свободно плавающая» структура, подвешенная тремя тяжами некостной ткани к несущему скелету как таковому. В этом и состоит своеобразие этой кости.

Поскольку гортань подвешена ниже гиоида, в наших попытках реконструировать его положение на ископаемом материале необходимо определить, когда гортань оказалась в постоянном нижнем положении (Lieberman, Crelin 1971). Сначала полагали, что решению этой задачи поможет измерение угла между базилярной частью затылочной кости и телом клиновидной кости (basicranial angle). Долгое время считали, что ответ следует искать именно здесь (George 1978; Laitman et al. 1978; Crelin 1987). Изгиб основания черепа (basicranial angle) измеряется по нескольким хорошо выраженным краниометрическим (черепным) точкам, расположенным по медиальной линии: базиону — самой нижней точке переднего края большого затылочного отверстия, опистокраниону — наиболее удаленной части затылка, и назиону — точке пересечения носолобного шва с передней срединной линией.

Опираясь на очевидную взаимозависимость между величиной basicranial angle и положением базигиоида, все эти исследователи сходились во мнении о таком же высоком положении гиоида, корня языка и гортани у ископаемых гоминид, какое мы находим у человекообразных обезьян и новорожденного младенца. Позже пристальный анализ преобразований basicranial angle у растущих детей, проведенный с помощью рентгенокиносъемки показал отсутствие корреляций этого процесса с уровнем расположения гортани (Lieberman, McCarthy 1999). Оказалось, что ни первоначальное, ни повторное ее опускание в период полового созревания не обнаруживают очевидных зависимостей от basicranial angle (Fitch, Giedd 1999). Таким образом, даже у людей обсуждаемая взаимосвязь слаба или отсутствует, что недавно признал и сам Либерман (Lieberman 2006; 2007a). Позже он, однако, стал утверждать, что о морфологии голосового тракта ископаемых гоминид можно судить по длине их шеи (см. Fitch 2009).

Рассмотренные выше сравнительные данные по видам с низко расположенной гортанью или гиоидом также не указывают на изменения угла плоскости основания черепа. Подвижность вокального аппарата млекопитающих во время вокализации показывает, что характер этих перемещений не может быть установлен на ископаемом материале. Австралопитеки и неандертальцы могли иметь высоко расположенные гиоид и гортань и опускать их во время вокализации. Все это говорит о том, что мы не располагаем достаточным эмпирическим материалом, чтобы судить о фонетических возможностях ископаемых гоминид (или других млекопитающих).

8.7.2. Другие предлагаемые палеоантропологические свидетельства эволюционных изменений в анатомии вокального аппарата

К сожалению, не лучше обстоит дело и со многими другими категориями явлений, которые привлекались в качестве детерминантов эволюционных изменений в анатомии вокального аппарата. Наиболее часто обыгрывали идею связи этих трансформаций с переходом гоминид к прямохождению (см., например, Negus 1949; Falk 1975). Это едва ли справедливо хотя бы потому, что переход к бипедализму имел место во многих группах животных (например, всех птиц37, кенгуру и т. д.) и не сопровождался при этом опусканием гиоида и гортани. Многие животные принимают вертикальное положение во время поедания пищи, а такие приматы, ведущие древесный образ жизни, как гиббоны и паукообразные обезьяны, много времени проводят в полностью вертикальном положении. Но ни одного из перечисленных видов не описано опускание гортани, а значит, переход к прямохождению не может служить объяснением преобразованиям вокального тракта у гоминид38.

Еще одна гипотеза предполагает, что в ходе эволюции гоминид имело место укорочение лицевой части черепа, связанное с переходом к прямохождению, что и повлекло за собой опускание гортани и гиоида (DuBrul 1958; Aiello 1996). В этом отличие строения черепа человека от того, что мы видим у шимпанзе и неандертальца. Уплощение лицевой части черепа ведет, в частности, к укорочению полости рта (главная причина запаздывания в появлении зуба мудрости) и к уменьшению расстояния между нёбом и передней проекцией позвоночного столба (Aiello, Dean 1990). Последнее связано с перемещением большого затылочного отверстия (foramen magnum) и позвоночника вперед и достижению более сбалансированного положения черепа, наилучшим образом отвечающего положению тела при прямохождении (у шимпанзе foramen magnum направлен назад, а у современного человека почти строго вниз). На основании этих фактов делается предположение, что из-за отсутствия достаточного места в задней части ротовой полости не может сформироваться «перемычка» (seal) между глоткой и носовой полостью. Эту гипотезу невозможно опровергнуть из-за отсутствия сравнительных данных (мне неизвестны виды животных, которым был бы свойственен бипедализм в сочетании с укорочением морды). Тем не менее, я считаю ее неубедительной, имея в виду, что «перемычка» формируется из мягких тканей занавески и надгортанника, и потому должна быть эластичной. Ни маленьких детей с их укороченной лицевой порцией черепа, ни у выведенных пород собак и кошек с укороченной мордой не возникает препятствий к формированию перемычки. Поэтому сегодня нет оснований полагать, что прямохождение само по себе или в сочетании с другими факторами может автоматически вести к опусканию гортани и перестройке вокального тракта.

Другой подход к объяснениям особенностей вокальной анатомии вымерших гоминид был стимулирован находкой базигиоида неандертальца в Израиле, именуемого Кибара гиоидом (Arensburg et al1989; 1990; 1994). Найденное образование характеризуется значительной массивностью, как и весь скелет неандертальцев, но по другим признакам выглядит сильно продвинутым в сторону наблюдаемого у современного человека. Это послужило поводом для предположения, что неандертальцам была свойственна вокальная анатомия современного типа. На него быстро возразили, что аргументация неубедительна (Laitman et al. 1990), хотя бы потому, что морфология гиоидной кости сама по себе не определяет его положения в вокальном тракте. Важно знание расположения мышц и связок, на которых он подвешен в трех точках. При сокращении грудино-подъязычной мышцы базигиоид движется вниз (как это происходит во время лая у собаки и при вокализации других животных), а при сокращении двубрюшной и шилоподъязычной мышц — вверх. В соответствии с этой схемой, гиоид ребенка находится в верхней позиции, и никаких изменений в его структуре не наблюдается при повторном опускании гортани в период полового созревания. Таким образом, продвинутое строение гиоида неандертальца ничего не говорит о его расположении в глотке.

Рис. 8.8. Эволюция гиоидной кости («Эволюция языка»)

Рис. 8.8. Эволюция гиоидной кости. Предполагается, что базигиоид исходной чашевидной формы трансформировался в существующий у человека ныне, в период между эпохами австралопитека и неандертальца. В то же время гоминиды утратили воздушные мешки, которые вдаются в полость гиоида у человекообразных обезьян

В то же время находка Кибара гиоида интересна с точки зрения вопроса о гортанных воздушных мешках, в том смысле, что она дает основания предполагать утрату этих образований на стадии, предшествующей появлению неандертальцев. От этой кости соответствующие образования у гориллы, шимпанзе и австралопитека отличаются тем, что у них базигиоид впячивается в тонкостенную полость гиоидного пузыря (hyoid bulla), в которую заходили частично и воздушные мешки. Такая картина часто наблюдается у приматов с объемными воздушными мешками, так что ее можно считать для них типичной (Kelemen, Sade 1960; Hilloowala 1975). Гиоид такого же строения присутствует у юного австралопитека, найденного в Дикика в Эфиопии (Alemseged et al. 2006). Следует, однако, сказать, что описанная закономерность соблюдается не всегда. Так, у орангутана с его весьма объемными воздушными мешками гиоидный пузырь отсутствует (Aiello, Dean 1990). Редкие случаи патологического развития гортанных воздушных мешков у людей (воздушная киста гортани — laryngocele) не приводит к каким-либо изменениям в структуре гиоида (Micheau et al1978). Таким образом, нет абсолютных доказательств утраты воздушных мешков на стадии, предшествовавшей эре неандертальцев, так что вопрос о времени их исчезновения в эволюции рода Homo остается открытым (рис. 8.8).

8.7.3. Неврологические структуры, предположительно связанные с контролем вокализации

Несколько авторов предложили оценивать речевые возможности вымерших гоминид, ориентируясь на детали строения их нервных структур. Это, в первую очередь, подъязычный канал (hypoglossal canal) в основании черепа, через который проходят нервы, управляющие мускулатурой языка (Kay et al1998). С учетом важнейшей роли контроля над языком в генерации речи человека и малого значения этого фактора в вокализации большинства прочих млекопитающих эти авторы предполагают, что расширение этого канала может указывать на появление речи. Сначала ими было показано, что у человека он значительно шире, чем у человекообразных обезьян. Однако при более тщательных измерениях на большем материале выяснилось, что ширина канала у людей подвержена высокой изменчивости с перекрыванием значений, полученных для человекообразных обезьян (DeGusta et al1999). В конце концов было признано, что эмпирические данные не подтверждают гипотезу Кея с соавторами, с чем они согласились (Jungers et al. 2003).

Другая гипотеза, кажущаяся сегодня достаточно правдоподобной, ставит в центр внимания расширение спинномозгового канала у современного человека (и неандертальца). Это явление было документировано сравнительными анатомами Энн МакЛарнон и Гвен Хьюит, которые сопоставили показатели диаметра канала у человека и прочих приматов (MacLarnon, Hewitt 1999). Нейроны спинного мозга управляют работой многих мышц, вовлеченных в процесс дыхания, в особенности межреберными и брюшными. Они принимают участие в контроле над тонкими перепадами давления воздуха в легких при речи и пении (Ladefoged 1967). МакЛарнон и Хьюит тщательно анализировали гипотезы, согласно которым утолщение спинного мозга могло быть связано с неречевыми функциями (например, увеличения контроля над дыханием как таковым), и отвергли их на хорошо продуманных основаниях. Таким образом, первоначальная гипотеза этих авторов о тесной связи изученных морфологических изменений с речью выглядит сегодня весьма правдоподобной. Данные по диаметру спинномозгового канала ископаемых животных довольно ограничены. Но обширные материалы по ныне живущим приматам, а также по ископаемым останкам нескольких неандертальцев и человека современного типа (например, так называемого «мальчика из Турканы», относимого к виду Homo ergaster), позволяют прийти к выводу, что расширение спинномозгового канала могло иметь место в период длительностью около миллиона лет между временем существования Homo ergaster и появлением на эволюционной сцене неандертальцев (позже господства Homo erectus или H. heidelbergensis).

Установление гипотетической связи между утолщением спинномозгового канала и контролем над дыханием позволяет сделать дополнительные предположения. По мнению некоторых исследователей, пение требует более тонкого респираторного контроля, чем речь (Sundberg 1987; Fitch 2009). Они полагают, что поддержание постоянного строгого контроля над давлением воздуха в области ниже голосовой щели (ради устойчивости амплитуды и частотных характеристик звука) при пении должно быть задачей более сложной, чем соответствующие процессы в речи, где частотные характеристики звука варьируют более широко. Эти предположения согласуются с мнением Дарвина, согласно которому приобретение способности к пению в эволюции человека предшествовало появлению осмысленной речи (Darwin 1871; Livingstone 1973; Brown 2000; Marler 2000; Mithen 2005). Обсуждение справедливости этой гипотезы см. в главе 14.

8.7.4. Резюме

В этой главе я рассказал о том, что, поскольку ткани вокального тракта не подвергаются фоссилизации, попытки его реконструкции базируются на косвенных свидетельствах и потому едва ли могут привести к надежным заключениям. Более того, если даже по счастливой случайности удалось бы найти труп неандертальца, сохранившийся в замороженном состоянии во льду альпийского ледника, само по себе низкое положение гортани и корня языка не могло быть расценено в качестве неоспоримого довода в пользу обладания ими речью. Точно так же строение вокального тракта льва не говорит о том, что эти животные способны говорить. Но и высокое положение гортани у нашего неандертальца не было бы достаточным основанием считать его неспособным к вербальному поведению. Большую надежду дают попытки реконструкции изменений в системе нервного контроля (гипотеза МакЛарнон и Хьюит), но и здесь предположения о ходе филогенетических преобразований будут ориентировочными. Я попытался показать, что роль низкого положения гортани в системе представлений об эволюции речи оказалась преувеличенной, а объяснения неспособности животных к артикуляции неубедительными.

На основе приведенного здесь обзора литературы я прихожу к выводу, что это направление исследований отвлекает внимание от вопросов, столь же интересных, но более доступных для эмпирической проверки (Fitch 2000b: 263). Создается впечатление, что критическим моментом в эволюции речи были преобразования в организации нервного контроля, а не изменения периферических структур голосового тракта. Впрочем, хотя на основе палеоантропологических данных мало что можно сказать о хронологии изменений во владении речью, полученные здесь негативные результаты знаменуют собой прогресс в этой области, обязанный деятельности таких ученых, как Либерман, Картмилл и Кей. Только на базе предложенных ими гипотез стали возможны исследования строения и функционирования вокальных трактов целого ряда видов млекопитающих, которым была посвящена значительная часть этой главы.


1 Точнее было бы сказать, что язык — это способ категоризации внешнего мира, его дифференциации, отраженной в дискретных концептах. Как писал Лурия (1979), «...человек отличается от животных наличием языка как системы кодов, обозначающих предметы и их отношения, с помощью которых предметы вводятся в известные системы или категории. Эта форма кодов ведет к формированию отвлеченного мышления, к формированию „категориального“ сознания». — Прим. науч. ред..

2 У птиц голосовых связок нет. Голосовым аппаратом у них служит нижняя (певчая) гортань, находящаяся на границе перехода дыхательного горла в главные бронхи. — Прим. науч. ред.

3 Проходя через полости глотки, рта и носа, поток воздуха вызывает дополнительные колебания структур, находящихся в просвете этих полостей. В результате несущая частота обогащается дополнительными частотами в виде так называемых гармоник. Термин форманта обозначает определенную частотную область, в которой вследствие резонанса той или иной полости усиливается некоторое число гармоник тона, производимого голосовыми связками. В спектре звука форманта является достаточно отчетливо выделяющейся областью усиленных частот. — Прим. науч. ред.

4 Фигурально: беспорядочное течение. — Прим. науч. ред.

5 Все это было хорошо известно еще в XIX веке. — Прим. науч. ред.

6 Впервые миоэластическая теория голосообразования была сформулирована А. Феррейном в 1741 году. — Прим. науч. ред.

7 В этом отличие от генерации звуков у некоторых видов рыб, где в процессе участвуют сокращения мышц воздушного пузыря, что требует управления характером вибрации со стороны нервной системы (Bass, Baker 1997). — Прим. автора.

8 Один килогерц — 1000 циклов колебаний в секунду. — Прим. автора.

9 Такой половой диморфизм в вокализации характерен для гиббонов. — Прим. науч. ред.

10 О том, как структура может вибрировать одновременно с разными частотами, можно видеть, положив на ложку кусочек желе. — Прим. автора.

11 Этот абзац переведен буквально, но его текст непонятен и неверно отражает суть дела. Струя воздуха не может фильтровать сигнал. Не форманты фильтруют частоты, а сами они являются результатом автоматического отбора тех или иных резонансных частот. Длина вокального тракта — далеко не единственный контролирующий фактор порождения формантной структуры звуковых частот.

В действительности, форманта — это определенная область в частотном спектре звука, в которой вследствие резонанса той или иной полости усиливается некоторое число гармоник тона, производимого голосовыми связками. Резонанс полости зависит от ее размера и формы. Например, в ротовой полости эти параметры регулируются разными положениями языка, за счет чего меняется формантная структура гласных.

12 Этот фрагмент текста (начиная с начала абзаца) переведен буквально. В таком виде его содержание не выдерживает ни малейшей критики. Губы трубача не относятся к структуре трубы, так что аналогия оказывается по меньшей мере искусственной. Не столбик воздуха аналогичен вокальному тракту, а просвет полости инструмента. Звук не может «проходить через воздух». Сам столб воздуха в трубе, вибрирующий под напором выдоха музыканта, и есть тот самый звук, который производит инструмент. Все сказанное здесь — чистейший нонсенс с точки зрения акустики. — Прим. науч. ред.

13 В нашей лаборатории показано, что сигнал «долгий крик» у чаек воспроизводится по принципу прохождения вибрирующей струи воздуха через трубку с постоянным, никак не меняющимся просветом (неопубликованные данные В. И. Грабовского). — Прим. науч. ред.

14 Выпячивания слизистой оболочки гортани, играющие роль резонаторов при голосообразовании. Эти образования хорошо развиты не только у человекообразных обезьян, но также у ряда других видов приматов, копытных и прочих млекопитающих. — Прим. науч. ред.

15 О том, как это было сделано, см. Панов Е. Н. Знаки, символы, языки. [2005] 2011. Гл. 3: Говорил ли неандертальский человек? — Прим. науч. ред.

16 В действительности устройство было гораздо более сложным. Роль дыхательной системы исполняли мехи, в качестве голосовых связок использовались проскакивающие язычки из слоновой кости (как в язычковых музыкальных инструментах), ротовая полость и носовые ходы имитировались специальными камерами, сделанными из каучука. Струя воздуха из мехов поступала в «ротовую полость» не только через язычковый «генератор» частоты, но также по отдельному каналу, что позволяло увеличивать давление в камере при плотном закрытии «рта» для получения взрывных фонем. Плюс к этому машина имела небольшие мехи (приводимые в действие пружиной), которые производили дополнительный выброс потока воздуха. Участие в звукообразовании «носовой составляющей» регулировалось открытием или закрытием деревянных «ноздрей». Управление машиной осуществлялось при помощи обеих рук оператора — предплечьем правой руки качали мехи, а пальцами воздействовали на три рычага, отвечавшие за отдельные фонемы, управляли «ноздрями», в то время как левой рукой управляли параметрами резонанса «рта», открывая и закрывая его. Машина, вполне удобоваримо выговаривая отдельные фонемы, весьма фальшиво воспроизводила другие. Хуже всего дело обстояло с согласными «д», «т», «г», «к», а некоторое подобие «л» оператор мог получить, лишь засунув большой палец в каучуковый «рот». См. Нечитайло С. Музыкальное оборудование. 2004. В статье дана детальная история синтезаторов речи, от первых опытов до наших дней. — Прим. науч. ред.

17 Эти изменения просвета вокального тракта в форме, более доступной для понимания, даны на рис. 39 и 40 в сборнике статей Speech of primates (Lieberman P. 1972) и в модифицированном для большей наглядности рис. 3.2 в книге Е. Н. Панова «Знаки, символы, языки» (2005; 2011). — Прим. науч. ред.

18 Читающая машина — это фрагмент технологии, дающей возможность невидящим читать печатный текст (Assistive Technology). Она позволяет переводить сканируемый текст в звуковые сигналы посредством синтезатора речи. — Прим. науч. ред.

19 Haskins Laboratories — независимое международное сообщество ученых, занятых междисциплинарными исследованиями всех аспектов языкового поведения людей. — Прим. науч. ред.

Haskins Laboratories is an independent, international, multidisciplinary community of researchers conducting basic research on spoken and written language, and forging partnerships across the sciences, it produces groundbreaking research that enhances our understanding of — and reveals ways to improve or remediate — speech perception and production, reading and reading disabilities, and human communication.

20 Развернутый и весьма содержательный анализ формантной структуры в вокализации макака резуса, гориллы и шимпанзе в сравнении с соответствующими данными по новорожденным детям дан в ряде статей сборника «Speech of primates» (Lieberman P. 1972). — Прим. науч. ред.

21 Вид не указан. — Прим. науч. ред.

22 Понятие «конвергенция» трактуется здесь чересчур вольно. В данном контексте это звучит так же, как если бы мы сказали, что большие размеры слона и кита есть следствие конвергенции, что, разумеется, абсурдно с точки зрения биолога-эволюциониста. — Прим. науч. ред.

23 В этой работе пасущимся самкам проигрывали синтезированные голоса самцов разной акустической структуры (несущая частота без формантных компонентов, формантные составляющие с высокочастотным и низкочастотным спектрами). Оказалось, что наибольший интерес (кратковременное прекращение пастьбы) у самок вызывают звуки, относящиеся к последней категории. Этот факт можно интерпретировать самым различным образом, но трудно расценивать как сколько-нибудь надежное свидетельство в пользу обсуждаемой гипотезы. То же самое можно сказать в отношении множества публикаций на эту тему, появляющихся в последнее время. — Прим. науч. ред.

24 Здесь перед нами типичный пример того, что называется «нанизыванием гипотезы на гипотезу», ни одну из которых нельзя считать хоть сколько-нибудь обоснованной. — Прим. науч. ред.

25 Это предложение переведено буквально, хотя такой перевод противоречит правилам русского (возможно, и английского) языка. Противоречит он и логике автора. Выше говорилось о том, что снижение частотных характеристик формант искажает информацию о размерах отправителя сигнала, как о больших, чем они есть в действительности. Здесь же утверждается, что эта информация «честная». Именно попытке согласовать одно с другим служит неудобоваримое вводное словосочетание «хотя и преувеличены». — Прим. науч. ред.

26 У львов только самцы охраняют групповую территорию прайда. — Прим. науч. ред.

27 Переведено буквально. — Прим. науч. ред.

28 Переведено буквально. — Прим. пер. Только очень доверчивый читатель сочтет ее «четкой». — Прим. науч. ред.

29 Переведено буквально. — Прим. науч. ред.

30 См. сноску 24 к этой главе. — Прим. науч. ред.

31 Минимальный уровень звукового давления сигнала, при которых сигнал может быть воспринят.

32 О сомнениях лингвистов по поводу такого заключения см. сноску 10 к главе 3. — Прим. науч. ред.

33 Грызуны семейства Chinchillidae. — Прим. науч. ред.

34 Эффект Мак-Гурка — феномен восприятия, который демонстрирует взаимодействие между слухом и зрением в восприятии речи. Он предполагает, что восприятие речи мультимодально, то есть вовлекает информацию сразу из нескольких органов чувств. Сдвоенное восприятие — адекватная интеграция разных формант гласной одного и того же слога, поступающих в разные уши. Компенсирующий эффект — изменение в одном акустическом признаке фонемы компенсируется изменением в другом, так что сохраняется ее адекватное звучание. — Прим. науч. ред.

35 У ребенка, пока он не имеет опыта в языке, вербальные сигналы запечатлеваются в перцептивном пространстве, все элементы которого расположены более или менее равномерно. По мере накопления языкового опыта субъект подвергается воздействию языкового материала, среди которого постоянно встречаются наиболее распространенные и типичные фонетические образцы — прототипы. При повторении воздействий прототип приобретает свойство притягивать к себе близкие звуки, он становится для них своего рода магнитом. Тогда перцептивное пространство языковых звуков искажается, в нем возникают зоны сгущения и разряжения. В результате этого образуются фонетические категории, входящие в них образцы становятся трудно различимыми между собой. Зато фонетические признаки, относящиеся к разным «зонам сгущения», т. е. к разным категориям, сравнительно легко различаются (Ушакова Т. Н. Принципы развития ранней детской речи // Дефектология. № 5. 2004. С. 4–16). — Прим. науч. ред.

36 Прямо противоположного мнения придерживаются С. Пинкер и Р. Джекендофф, которые считают, что гипотеза Либермана, согласно которой восприятие речи специфично для языковой способности человека в узком смысле, остается в силе. См. об этом с. 265–268 в сборнике «Разумное поведение и язык: Коммуникативные системы животных и язык человека. Проблема происхождения языка». М.: Языки славянских культур, 2008. — Прим. науч. ред.

37 Птицы, головой аппарат которых построен иначе, чем у млекопитающих, здесь вообще ни при чем. — Прим. пер.

38 Здесь перед нами некорректный силлогизм, построенный на приравнивании друг другу вроде бы одинаковых признаков, искусственно вырванных из систем, которые базируются на столь разных причинных основаниях, что едва ли сопоставимы в принципе. Это типичный пример ложных аналогий, которых немало и в других местах этой главы. — Прим. пер.


* Рис. 8.2 не дает ни малейшего представления о сути происходящего, а лишь вводит в заблуждение. Все это заставляет предупредить читателя о необходимой осторожности при восприятии им дальнейших положений, преподносимых в этой главе. — Прим. науч. ред.


Комментировать


 


при поддержке фонда Дмитрия Зимина - Династия