Анализ, синтез и восприятие речи - Джеймс Л. Фланаган
Скачать (прямая ссылка):
Белл впоследствии говорил, что это устройство можно было заставить произносить гласные и носовые звуки, а также связные звукосочетания (по-видимому, достаточно хорошо, чтобы привлечь внимание соседей). Интересно поразмышлять о том, насколько это юношеское увлечение повлияло ма появление патента США № 174.465 от 14 февраля 1876 г.—!вероятно, одного из самых замечательных в .истории.
224
СИНТЕЗ РЕЧИ
Мальчишеский интерес Белла к речеобразованию посудил его к опытам с собакой—терьером Скай. Белл приучил ее сидеть на задних лапах и непрерывно рычать, а сам в это время манипулировал ее голосовым трактом рукой. Окончательный звуковой репертуар собаки состоял из гласных /а/ и /и/, дифтонга /ои/ -и слогов /та/ « /ga/. Вершиной ее лингвистического !образования была фраза «How are you, Grandmamma?* («Как поживаешь, бабушка?»). Собаке, по-видимому, очень нравилось вкусное угощение, полагавшееся при опытах, и она пыталась «говорить» без посторонней помощи. Однако ей никогда не удавалось произнести что-нибудь отличное от обыкновенного рычания. Как утверждал Белл, эта история является единственным оправданием слуха о том, что он однажды научил говорить собаку.
Интерес к механическим моделям голосовой системы сохранился и в двадцатом веке. Среди исследователей, добившихся глубокого понимания природы человеческой ,речи, был Ричард Пейджет (Richard Paget). Он не только создал из гипсовых труб точные модели голосового тракта, но и достиг высокого мастерства в умении руками создавать конфигурации речевого тракта. Пейджет мог буквально «говорить руками», складывая кисти рук гак, что образовывалась полость, которую он возбуждал либо с помощью язычка, либо губами, вибрирующими, как при игре на трубе.
Примерно в это же время исследователи Гельмгольц, Д. С. Миллер, Штумпф и Кёниг (Helmholz, D. С. Miller, Stumpf and Koenig) занялись искусственной речью с иных позиций, положив в основу своей работы яе столько процесс образования речи, сколько процесс ее восприятия. Гельмгольц синтезировал гласные звуки, заставив набор камертонов, настроенных на определенные частоты, вибрировать с заданными амплитудами. Миллер и Штумпф получили тот же результат с помощью органных труб. Кёниг синтезировал гласные еще одним методом: на вращающиеся зубчатые колеса (направлялись струи воздуха.
Рис. 6.2. Механический речевой тракт Риша: 1 — губы, 2—иоздря, 3 — зубы, 4 — рот, 5 — мягкое иебо. б —глотка
В последние годы была предложена еще одна конструкция механического говорящего устройства (ірис. 6.2) (Риш—Riesz, 1937, публикации не было). Снатый воздух поступает справа из резервуара. Потоком воздуха управляют два клапана — и Кг. Клапан Ki, ,пропускает воздух ,в камеру Lu
МЕХАНИЧЕСКИЕ ГОВОРЯЩИЕ МАШИНЫ
225
в которой закреплен язычок, при вибрации которого прерывается воздушный поток так же, как это происходит при вибрации голосовых связок. Эффективная длина язычка, а значит, и основная частота его івибраций изменяются скользящим прижимным устройством. Неозвученные звуки получаются при пропускании воздуха через клапан Кг- Конфигурация голосового тракта изменяется перемещающимися элементами: губами, зубами, языком, глоткой и клапаном мягкого неба.
Для упрощения управления конфигурацией голосового тракта Риш снабдил свою говорящую машину клавишами, а для губ и зубов сделал только по одному органу управления (элементы 1, 3 работали парами). Такое упрощенное устройство вместе с клавишами показано на рис. 6.3. Зачерненные
і 2 3 « 5 6 7 8
Рис. 6.3. Клавиатура управления механическим говорящим устройством Риша
участки означают мягкие резиновые покрытия, нанесенные для получения смыканий и затухания, близких к реальным. Клавиши 4 и 5 управляют клапанами возбуждения Ka и Ks, устроенными несколько по-иному, чем клапаны Ki и Кг на рис. 6.2. При получении глухих звуков воздух пропускают через клапан K4 и отверстие в передней части тракта (под элементом 6). Клапан Кь направляет воздух в язычковую камеру озвученного возбуждения. В этом случае основной тон управляется воздухом, проходящим через клапан Ki- Опытный оператор мог заставить эту машину имитировать связную речь. Согласно частному сообщению Р. Р. Риша, одним нз наиболее удачных «высказываний* машины было слово «cigarette».
Интерес к механическим моделям сохраняется и в наше время. Основной причиной этого является необходимость имитации и измерения нелинейных эффектов в голосе, которые с трудом поддаются расчетам и не могут быть моделированы с помощью линейных устройств. К числу параметров, при измерении которых в реальном голосовом тракте встречаются большие трудности, относятся положение, интенсивность, спектральный состав и в'нутрен-
8—71
226
СИНТЕЗ РЕЧИ
ний импеданс источника возбуждения для глухих звуков. Один из способов получения данных об этом источнике связан с использованием механических моделей. На рис. 6.4 а показано устройство для проведения подобных измерений по Гейнцу (Heinz, 1958).
1,гсм і
возЛ/штй^г— поток j-i—