Анализ, синтез и восприятие речи - Джеймс Л. Фланаган
Скачать (прямая ссылка):
Коэффициенты изменяются во времени сравнительно медленно. Поэтому их используют для управления электрическим четырехполюсником, чтобы его частотная характеристика приблизительно соответствовала измеренной спектральной огибающей речевого сигнала. Затем четырехполюсник возбуждается тем же способом, что в обычном вокодере, т. е. периодическими импульсами или шумом. Синтезированная речь получается на выходе четырехполюсника с переменной частотной характеристикой (рис. 8.21).
Действие управляемого четырехполюсника основано на том факте, что s(l) в действительности представляет спектральные
амплитуды S(co), 0<(о<сомакс. Поскольку Q= =-, соот-
T ммакс
ношение (8.12) может быть переписано:
N
2я П (D
+ bn sin
2я п ш
(8.13)
OnCOS
шмакс
ммакс
Если амплитудный спектр возбуждения обозначить G(со), спектр сигналов на выходе четырехполюсника с переменной частотной характеристикой будет S(co)G(co). Принимая, что спектр
ДРУГИЕ МЕТОДЫ СОКРАЩЕНИЯ ПОЛОСЫ
369
возбуждения равномерен и имеет единичную амплитуду, некоторый гармонический компонент частоты со і в спектре возбуждения дает на выходе временную функцию
N
hit) = sin см + sin CO1 /Vfl^cos 2яйЮі +
" мтя шмакс
п=1
N
+ sin CO11 VA, sin 2ппщ . (8.14)
jmmi '"макс
я=1
Раскрывая второй и третий члены, получаем суммы и разности углов:
N
2/i(0 = ?o Sin <м+ ^TJflf, [sin^--2цЙЮі ) +
л=1
N
+ Sin CO1H--— + >*я COS (D1/--M
п=1
— COS [ CO11 + •
2л п (O1
(8.15)
Второй член аргумента, т. е. -соответствует времен-
CD1
макс
ному опережению или отставанию на «т = п-. Таким обра-Юмакс
зом, временная функция может быть получена с помощью схемы рис. 8.22. Косинусные члены соотношения (8.15) получаются от синусных членов путем преобразования Гильберта (т. е. при включении в схему рис. 8.22 широкополосного фазовращателя
на "Y" J- Хотя соотношение (8.15) получено для некоторого одного данного спектрального компонента возбуждения, а именно для сої, процесс аналогичен и для других компонентов. Считается, что при N, равном 4 или 5, качество синтезированной речи достаточно удовлетворяет требованиям обычных каналов телефонной связи.
Разложение мгновенной функции автокорреляции. В гл. V
для функции времени f(t) выведено соотношение между мгновенной автокорреляционной функцией
t
<р(т,*)= J / (X) / (X — т) ft — d X; т>0, (8.16)
370
СИСТЕМЫ СИНТЕТИЧЕСКОЙ ТЕЛЕФОНИИ
и физически измеряемым мгновенным спектром амплитуд
FКt)= J' /WНЦ-Це~мdк (8.17)
-OO
В случае весовой функции k(t) =h2(t) =2ae~2at мгновенные функция автокорреляции и спектр связаны между собой взвешенным косинус-преобразованием Фурье:
OO
\F(<*, t)\2= J е-°(т) ф(¦M)COS(OTdT =±\Н(а)\* *Ф(со, t),
— OO
(8.18)
где //(со) и Ф(со, г) являются преобразованиями Фурье h(t) и Ф(т, t) соответственно. Из пары преобразований (8.18) следует, что ф(т, Г) является четной функцией т.
Симметричная линия задержки
-ЗГ -2с -fir О Jt 2с Sc
Рис. 8.22. Способ осуществления четырехполюснике с переменной частотной характеристикой в схеме рис. 8.21
В предыдущем параграфе описан метод представления модуля CHeKTPaIF(CO, t) | рядом по ортогональным функциям. Поскольку функция корреляции и энергетический спектр однозначно связаны, следует ожидать, что соответствующее ортого-
ДРУГИЕ МЕТОДЫ СОКРАЩЕНИЯ ПОЛОСЫ
371
нальное разложение может быть записано и для корреляционной функции. В частности, удобными для такого описания оказались функции Лагерра (Ли—Lee; Мэнли—Manley; Куля).
Предположим, что мгновенная функция автокорреляции сигнала f(t) для положительных значений аргумента разлагается в ряд по системе (і)} физически реализуемых функций, ор-тонормированных на интервале О <^<оо и равных нулю для всех т<0. Тогда
ф(+т, t) =2°'Wb(T); т>0. (8.19)
С учетом ортонормальности
OO OO t
at (t) = j Ф(+т, t) h (т) d т= j I1 (т) d X j / (к) t (X -
o O —оо
— x)k{t — x)d\ (8.20) Меняя порядок интегрирования и подставляя у=Х—т, получаем
OiW= J/(W-^ $f(v)lit-V)dy. (8.21)
щ-
W
Следовательно, коэффициенты cn(t) могут быть получены путем фильтрации f(t) с помощью четырехполюсников, импульсивные отклики которых равны i,i(t), с последующим умножением результата на f(t) и фильтрацией произведения другим четырехполюсником с импульсивным откликом k(t). Эти операции отражены на рис. 8.231).
Коэффициенты ui{t), полученные согласно (8.21), описывают <р(т, t) для положительных значений аргумента (т>0). Если в соответствии с определением и обсуждением, приведенными в гл. V, ф(т, t) является четной функцией т, то корреляционная функция для отрицательных значений аргумента запишется в виде
Рис. 8.23. Определение коэффициентов разложения мгновенной функции автокорреляции
Фоо (-*>') =2 a'"WI'(_T)' Т<0'
(8.22)
t=0
') Впервые возможность применения этого метода для мгновенного корреляционного анализа показана * В. И. Кулей (прим. перев.).