Научная литература
booksshare.net -> Добавить материал -> Лингвистика -> Джеймс Л. Фланаган -> "Анализ, синтез и восприятие речи" -> 58

Анализ, синтез и восприятие речи - Джеймс Л. Фланаган

Джеймс Л. Фланаган Анализ, синтез и восприятие речи. Под редакцией Пирогова А.А. — М.: Связь, 1968. — 395 c.
Скачать (прямая ссылка): analizsintivocrech1968.djvu
Предыдущая << 1 .. 52 53 54 55 56 57 < 58 > 59 60 61 62 63 64 .. 149 >> Следующая


Усилия в области анализа и синтеза речи направлены в основном на повышение эффективности передачи речевой информации1). Иначе говоря, основная цель состоит в передаче речевой информации по каналу, обладающему минимально возможной пропускной способностью, при условии удовлетворения определенному критерию верности восприятия. Анализ механизма речеобразования, выполненный на акустическом и физиологическом уровнях, позволяет выявить некоторые возможности для эффективного описания сигнала. Психологические и физиологические эксперименты по слуховому восприятию также помогают установить общие границы восприятия. Хотя подобные исследования не могут привести к нахождению оптимальных методов для кодирования и передачи, они позволяют обнаружить важные физические закономерности. Дальнейшие возможности повышения эффективности передачи речи связаны с использованием лингвистических и семантических закономерностей.

') Вероятно, одинаково важным следует считать как изучение основ человеческого общения, так и проблему управления машинами с помощью голоса.

СПЕКТРАЛЬНЫЙ АНАЛИЗ РЕЧИ

161

В гл. II и III рассматривались некоторые фундаментальные характеристики механизма речеобразования. В процессе анализа предполагалось наличие подробных физических сведений о тракте. Однако в условиях практического осуществления связи обычно имеются сведения только об одном варианте преобразованного акустического сигнала (т. е. говорящий ие предоставляет свой голосовой тракт на измерение). Таким образом, если в системе 'используются акустические и артикул ярные параметры, рассмотренные в предшествующих главах, то они должны быть определены непосредственно из речевого сигнала.

В настоящей главе предполагается рассмотреть способы анализа речи, которые считаются полезными для выявления некоторых так называемых «смыслоразличительных элементов» речи. В последующих главах будут рассмотрены синтез речи с помощью этих медленно меняющихся параметров, критерий восприятия, соответствующий способу приема таких параметров, н применение способов анализа и синтеза, а также результатов восприятия к созданию систем передачи.

Представление речевой информации в частотной области обладает преимуществами. Во-первых, акустический анализ механизма речеобразования показывает, что распределение нулей и полюсов коэффициента передачи дает достаточно четкое описание звуков речи. Во-вторых, совершенно очевидно, что в начальной стадии процесса восприятия ухо производит некоторый грубый частотный анализ. Таким образом, характерные особенности, которые проявляются в результате частотного анализа, по-видимому, играют важную роль в процессах восприятия и воспроизведения и, следовательно, содержат в себе возможности для эффективного кодирования. Это замечание подтверждается многочисленными экспериментами.

Установлено также, что механизм ,речеобразования является квазистационарным источником звуков с изменяющимися во времени характером возбуждения и частотной характеристикой. Поэтому любая спектральная характеристика, пригодная для речевого сигнала, должна отражать не только спектральные особенности воспринимаемых значений, но и временные особенности.

Обычная математическая связь между апериодической функцией времени f(t) и ее комплексным спектром плотности амплитуд F(a) выражается парой преобразований Фурье:

5.1. Спектральный анализ речи 5.1.1. Кратковременный частотный анализ

OO

F(CO)

f f(t)e-iatdt

¦—со

} ¦

(5-І)

-OO

J

6—71

162

УСТРОЙСТВА ДЛЯ АНАЛИЗА РЕЧИ

Чтобы преобразование существовало, выражение J \f(t) \dt

— OO

должно иметь конечную величину. Непрерывный речевой сигнал не удовлетворяет ни условию существования, ни условию определенности на бесконечном интервале времени. Следовательно, сигнал должен быть преобразован таким образом, чтобы его преобразование.существовало для случая, когда интегрирование производится в интервале известных прошедших величин. Кроме того, чтобы отразить важнейшие временные изменения, интегрирование следует производить только за такой отрезок времени, который соответствует длительности квазиустановивших-ся элементов речевого сигнала. По существу, желательно иметь не что иное, как текущий спектр с реальным временем в качестве независимой переменной, где для вычисления спектра используются взвешенные предшествующие значения сигнала.

Такого рода результат можно получить посредством анализа некоторой части сигнала, «просматриваемой» через особое временное окно, или весовую функцию. Весовая функция выбирается таким образом, чтобы ее произведение с сигналом давало функцию, обеспечивающую условие существования преобразования Фурье1). Для практических приложений весовая функция h(t) обычно представляет собой импульсный отклик физически реализуемой линейной системы. В таком случае для t<0, /і(ї) = 0. Обычно предпочитают, чтобы h(t) была униполярной и представляла собой, по-существу, отклик фильтра нижних частот. Следовательно, преобразование Фурье (5.1) можно видоизменить так, чтобы преобразованию подвергалась та часть сигнала, которая в данный момент времени просматривается через окно. Аналитически желаемый процесс можно выразить как
Предыдущая << 1 .. 52 53 54 55 56 57 < 58 > 59 60 61 62 63 64 .. 149 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed