Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 60

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 54 55 56 57 58 59 < 60 > 61 62 63 64 65 66 .. 149 >> Следующая


TCt —----л

Гильберта от u(t). Можно показать что u(t)v(t) = u(t)v(t)~

А

= u(t)v(t) при условии, что спектры u(t) и v(t) не перекрываются.

Используя эти соотношения и изменяя порядок интегрирования в свертке, получим

а'(со, *)= [/(*)* ft (<)cos «о/]

а'(со, *)=

fl'К/).-?-,] =

! JtJ ~~

(5.6)

h (t) COS Cd t * ¦

= /(0 * [Л (г) sin со /] = Ъ' (со, О

при условии, что частота со не попадает в спектр h(t). Таким образом, величина ( F((a, t)\ действительно является временной огибающей а'(со, t) либо Ь'(а, t) [а(сл, t) либо b(a, t)]. Эту огибающую можно электрически аппроксимировать формой огибающей на выходе фильтра в любой из ветвей фильтра, показанного на рис. 5.3. Обычно она получается в результате линейного детектирования с последующей фильтрацией с помощью фильтра нижних частот, как показано на рис. 5.4. При соответствующем выборе импульсного отклика фильтра нижних частот выходное напряжение \f(t) *p(t) \* q(t) приближенно описывает |F(co, t)\.

Способ измерения, показанный на рис. 5.4, является способом, используемым в широко известном звуковом спектрографе и в большинстве анализаторов спектра параллельного типа.

_а '(ш, t)um

По/іособоАь'ішЛ) ¦ фильтр ——*\i

P(t)

Детектор

<РНЧ q(t)

'\F(w,tj\

Рис. 5.4. Блок-схема измерения мгновенного спектра IF(со,/)] с использованием полосового фильтра, детектора и сглаживающей цепочки (фильтра нижних частот)

Этот способ обычно используется для получения мгновенного спектра в вокодерах и в некоторых устройствах для автоматического формантного анализа. Все эти применения подробно рассматриваются ниже.

На рис. 5.5 в качестве примера изображены следующие друг за другом графики мгновенного спектра озвученного образца

СПЕКТРАЛЬНЫЙ АНАЛИЗ РЕЧИ

167

речи, воспроизведенные гребенкой из 24 фильтров. При ширине полосы каждого фильтра примерно в 150 гц они перекрывают частотный диапазон от 150 до 4000 гц. За каждым фильтром следует выпрямитель и RC-це-почка. Сигналы, снимаемые с выходов гребенки фильтров, поочередно коммутируются IC периодом 10 мсек. Дискретные отсчеты спектра соединяются пря- ч? мыми линиями. Изображенные | здесь кривые развертки спектра | были автоматически вычерчены >| на вычислительной машине, в ко- '| торую вводились данные с выхо- | дов гребенки фильтров (Флана-ган, Кокер, Бёрд—Coker, Bird). Iі Линии, соединяющие пиковые 1 значения, представляют формантные частоты речи, которые были определены в процессе I WQ1 машинной обработки мгновенного спектра.

5.1.3. Выбор весовой функции

Для кратковременного анализа речи обычно представляется целесообразным отдельно рас-ом атривать такие свойства ГОЛО- Рис- 5'5' Мгновенные амплитуд-Г ные спектры речи, измеренные

са, как вокализованное и невока- гребенкой из 24 полосовых филь-лизованное возбуждения, часто- трое

та основного тона и формантная структура. Выбор весовой функции при анализе определяется в результате компромисса между разрешающими способностями по частоте и во времени. Короткая по длительности весовая функция соответствует фильтру с широкой полосой пропускания. С помощью такого фильтра можно произвести спектральный анализ, в процессе которого выделяется временная структура одного периода речевого сигнала. С другой стороны, весовая функция длительностью в несколько периодов основного тона соответствует фильтру с более узкой полосой пропускания. С помощью этого фильтра можно произвести анализ с разрешением по частоте каждой гармонической спектральной составляющей.

Чтобы проиллюстрировать порядок практически используемых величин полос пропускания и длительностей весовых функ-

собой «

0,1 0,5 1,0 2,0 10 Частота,кга

168

УСТРОЙСТВА ДЛЯ АНАЛИЗА РЕЧИ

ций, введем в рассмотрение идеальные анализирующие полосовые фильтры (которые, естественно, не могут быть реализованы) с прямоугольной амплитудно-частотной характеристикой и нулевой (либо строго линейной) фазовой характеристикой. Допустим, частотная характеристика фильтра имеет вид

P(o)=l; (<в0 — O)1) < со < (щ0 + O1)

= 1; — К + «i) < «< — К —oi) = 0 — на всем остальном диапазоне

Соответствующий ей импульсный отклик запишется как

P (t) = ( Smjy J cos <a0t = h (t) cos O0 (t),

(5.7)

(5.8)

Таблица 5.1

а весовая функция для этого идеального фильтра представляет собой огибающую иіміпульоного отклика вида sin х/х. Если в качестве эффективной длительности D весовой функции выбрать интервал времени между первыми нулями огибающей, то /> = 2я/ц>і =4я/Аи, где Асо = 2ац есть полоса пропускания фильтра1). Ниже, в табл. 5.1, в качестве примера приведены величины D, соответствующие нескольким значениям Ли.

В варианте 1 анализирующий фильтр имеет такую полосу частот, которая позволяет обеспечить необходимую точность анализа при выделении каждой гармонической составляющей на вокализованном участке речи. Этой полосе частот соответствует длительность временного окна, примерно равная четырем или пяти периодам основного тона мужского голоса.
Предыдущая << 1 .. 54 55 56 57 58 59 < 60 > 61 62 63 64 65 66 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed