Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 83

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 77 78 79 80 81 82 < 83 > 84 85 86 87 88 89 .. 149 >> Следующая


0,5см

7,5см 2,4см

4

Q1

I— 3?см -*¦

б)

I

зо

20

ГО

-10



А
Сужение в 4см' от рта







Jl




j

L
J










10* 2 5 10* 2

Частота , гц

Рис. 6.4. Механическая модель речевого тракта для имитации фрикативных согласных (а) и измеренный по Гейнцу спектр протяжного звука, похожего да /S/ (б):

/ — твердая деревянная сфера, радиусом 9 см, 2 — труба с твердыми стенками, 3 — скользящий поршень, 4 — микрофон, 5 — анализатор спектра

В этом устройстве сфера соответствующего размера является эквивалентом головы человека. Имеющаяся в сфере труба с сужением представляет голосовой тракт. Пропускаемый через суженную часть поток воздуха измеряется спектральным анализатором. На рис. 6.46 изображен типичный спектр для случая, когда сужение находится в трубе на расстоянии 4 см от «рта». Соответствующий звук отдаленно напоминает фрикативный /J/. Поскольку размер суженной части при произнесении фрикативных согласных обычно мал, спектральные резонансы определяются в первую очередь полостями, расположенными спереди от сужения. Антирезанансы происходят на частотах, при которых импеданс трубы со стороны рта бесконечен (см. раздел 3.6). Расчет показывает, что спектр самого источника возбуждения сравнительно равномерен. Установлено, что его общая мощность пропорциональна приблизительно пятой степени скорости потока.

ЭЛЕКТРИЧЕСКИЕ МЕТОДЫ СИНТЕЗА РЕЧИ

227

При исследованиях нелинейных свойств потока в голосовом тракте (ван ден Берг, Зантема и Дурнеибол—van den Berg, Zantema and Doornenbal; Мейер-Эпллер—Meyer-Epipler, 1953; Вегел—Wegel), проводимых в последние годы, использовался также ряд других механических моделей. По крайней мере, две из них имитировали поведение потока воздуха в голосовой щели.

6.2. Электрические методы синтеза речи

6.2.1. Методы восстановления сигналов с заданным спектром

С развитием электротехники интерес к синтезу речи получил более широкую основу. Академический интерес к физиологии и акустике речеобразующего механизма был дополнен возможностью использовать полученные данные для связи на расстояние. Хотя первым успешно примененным на практике был метод передачи целиком всего речевого колебания, многие изобретатели того времени отмечали резонансную природу голосового механизма и важность сохранения мгновенного спектра амплитуд для разборчивости речи').

Однако до аналитической формулировки и практического воплощения этих идей люди дошли очень нескоро.

') Выдающуюся роль среди изобретателей играл Александр Грэхэм Белл. События в связи с его опытами с «гармоническим телеграфом», которые натолкнули Белла, в марте 1876 г. на мысль использовать метод передачи полного речевого колебания, известны большинству студентов-связистов. По-вндимому, менее известной является идея Белла о спектральной передаче речи, которая очень похожа на идею полосного вокодера (Уотсон—Watson). Белл назвал эту идею «арфным телефоном» (harp telephone). Согласно этой идее телефон представлял собой длинный электромагнит, в магнитопровод которого включен ряд стальных язычков, настроенных на различные частоты н колеблющихся вблизи полюсов электромагнита. По мысли Белла, «язычки можно считать эквивалентами резонансных элементов органа Корти в человеческом ухе». Произнесенный около устройства звук должен вызвать колебание язычков в соответствии со спектральным составом звука. В результате индукции в обмотке магнита возникнет ток, сложная форма колебания которого определяется суммой колебаний всех язычков. Белл думал, что если этот ток подать на аналогичное устройство, то на приемной стороне соответствующие язычки начнут колебаться и воспроизведут исходный звук.

Это устройство, по словам Уотсон а, не было создано из-за денежных затруднений. Кроме того, не имея возможности усиливать сигналы, Белл думал, что ток иа выходе такого устройства окажется слишком слабым для того, чтобы его можно было использовать. (Однако Белл, работа? со своим гармоническим телеграфом, обнаружил, что магнитный преобразователь с диафрагмой, соединенный с приемной частью устройства, позволял получить слышимые звуки и от таких слабых токов).

Основой «арфного телефона» является идея о том, что разборчивость речи определяется ее мгновенным амплитудным спектром. Каждый язычок устройства можно считать одновременно и электроакустическим преобразователем, и полосовым фильтром. Если не считать смешивания отфильтрованных сигналов в общем проводе и отсутствия детектирующих и сглаживающих устройств, примененный принцип восстановления спектра поразительно похож на принцип полосного вокодера.

8*

228

СИНТЕЗ РЕЧИ

Гельмгольц, Д. С. Миллер, Р. Кёниг и Штумпф (Helmholz, D. С. Miller, R. Koenig and Stumpf) в начальной стадии своих опытов заметили, что акустические сигналы с правильно выбранными основной частотой и относительными амплитудами ее гармоник очень похожи на звуки речи. Другими словами, для синтеза звуков не обязательно пытаться скопировать голосовой механизм человека—необходимо иметь в виду лишь конечную цель, т. е. синтез звуков с такими характеристиками, которые обеспечивают их правильное восприятие. Одним из первых, кто с помощью электрического устройства продемонстрировал правомерность такого подхода, был Стюарт (Stewart). Он возбуждал систему из двух пар связанных контуров током, прерываемым со скоростью, равной основной частоте голоса. Настраивая должным образом эту систему, можно было имитировать протяжные гласные звуки. Недостаточная отработка устройства не позволяла получать связные звукосочетания. Несколько позже Вагнер (Wagner) предложил аналогичную систему, состоящую из четырех соединенных параллельно электрических резонаторов, возбуждаемых прерывателем тока. Выходные сигналы резонаторов складывались в определенных соотношениях для получения гласных звуков.
Предыдущая << 1 .. 77 78 79 80 81 82 < 83 > 84 85 86 87 88 89 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed