Научная литература
booksshare.net -> Добавить материал -> Психология -> Крёмер К. -> "Человеческий фактор. Том 5" -> 73

Человеческий фактор. Том 5 - Крёмер К.

Крёмер К. Человеческий фактор. Том 5 — М.: Мир, 1992. — 390 c.
ISBN 5-03-001817-4
Скачать (прямая ссылка): chelovecheskiyfactort51991.djvu
Предыдущая << 1 .. 67 68 69 70 71 72 < 73 > 74 75 76 77 78 79 .. 148 >> Следующая

Соркин и Вудс рекомендовали устанавливать рабочие параметры автоматической подсистемы тревоги с учетом рассмотрения деятельности всей системы и требований задачи к оператору. Они подчеркивали предпочтительность многоуровневого сигнала предупреждения для условий активного оператора. Тре-
Представление слуховой и тактильной информации
199
вога, например, с двумя или тремя уровнями приоритета могла бы сообщать о степени правдоподобия того, что автоматическая подсистема находится в состоянии боевой готовности; явные проблемные ситуации должны иметь один код, потенциальные проблемы — другой. Предупреждения, создаваемые определенными действиями оператора или тестовыми процедурами, могли бы попадать во вторую категорию.
6.2.9. Дисплеи для речевых сообщений
Речь часто рассматривают как средство уменьшения информационной перегрузки в исходной зрительной задаче, поскольку она позволяет с высокой скоростью осуществлять передачу информации через слуховой канал. Кроме того, развитие технологии генерации речи привело к созданию автоматических систем речевых сообщений, имеющих практическое значение для множества систем человек—машина. Однако остается ряд вопросов относительно оптимальных методов генерации сигналов речи и интегрирования этих сигналов с другими слуховыми сигналами, а также другими задачами оператора. Исследование этой области развивается быстро; здесь мы обсудим лишь небольшое число общих принципов и проблем речевых систем и дадим некоторые довольно общие рекомендации по их разработке.
Уровень речи и спектр
Энергия речевого сигнала варьирует в диапазоне примерно 30 дБ для разных речевых звуков: известно, что гласные звуки речи произносятся с большей энергией, чем согласные. Акустическая энергия гласных звуков концентрируется в гармонически связанных диапазонах частот, называемых формантами. Эти частоты соответствуют механическим резонансам речевого тракта. Первая форманта в зависимости от гласной и говорящего располагается где-то между частотами 200 и 800 Гц, вторая — в окрестности частоты 1500 Гц, третья — в области частоты 2400 Гц, четвертая — примерно вокруг частоты 3500 Гц. Наибольшая акустическая энергия сосредоточена на первых двух формантах, и совсем небольшая ее доля приходится на частоты выше 3500 Гц. Из-за способа генерирования речевой системой согласных звуков в спектре последних значительно больше энергии приходится на высокие частоты, чем на низкие; часть энергии приходится даже на область частот выше 5000 Гц. Однако избыточность естественной речи позволяет отфильтровать очень высокие и очень низкие частоты речевого сигнала без сильного ухудшения его разборчивости.
200 Глава 6
При выборе подходящего уровня и спектра речевого сигнала должны учитываться в целом те же закономерности, которые рассматривались в разд. 6.2.1—6.2.5; в частности, следует ограничиться частотным диапазоном 500...5000 Гц. Вследствие того что основная речевая информация передается с помощью согласных, которые имеют меньшую мощность, более короткие длительности и высокие частоты, чем гласные, создание необходимого динамического диапазона сигнала может оказаться проблематичным. Например, на фоне интенсивного шума уровень одних речевых звуков должен намного превышать уровень шума, для того чтобы другие более слабые речевые звуки не оказались ниже порога обнаружения. Может оказаться желательной обработка речевого сообщения, предшествующая его использованию в качестве предъявляемого сигнала: типа усиления компонентов речи с частотами выше 500 Гц или сжатия (ограничения) амплитуды волновой формы речи. Для речевых сообщений, предъявляемых в условиях кабины самолета, Паттерсон [31] рекомендует усиление 3 дБ/октава в области 0,5...
5 кГц.
Синтезируемая речь
Во многих системах с речевыми сообщениями генерация речи осуществляется искусственным образом посредством некоторого, обычно цифро-аналогового, процесса преобразования В ряде окружающих условий считается предпочтительнее генерировать речь с помощью компьютера, что вполне позволяет сохранить отчетливое восприятие речевых сообщений. Речь, генерируемая с помощью компьютера, бывает двух типов: 1) речь, создаваемая из первоначально произнесенной речи, которая была оцифрована и обработана для более эффективной передачи с пониженной битовой скоростью, и 2) речь, синтезируемая непосредственно из текстовых или программных строк с применением алгоритмов для акустической генерации цепочек фонем (в том числе правила фонематических переходов, правила ударения и т.п.). В зависимости от используемых методов генерируемая речь любого типа может казаться звучащей очень естественно, или с отчетливым акцентом, или же машиноподобно.
Синтезируемая речь обычно не является столь избыточной, как натуральная речь, вследствие чего она более чувствительна к влияниям лингвистического контекста и задачи, тренировки оператора, фонового шума и манипуляциям со спектром или уровнем При обработке информации в контексте определенных задач искусственная речь может иметь определенные дефекты, поэтому она может требовать более значительных ресурсов внимания, чем естественная речь Некоторые из перцептивных и когнитивных трудностей, связанных с синтетической неестест-
Предыдущая << 1 .. 67 68 69 70 71 72 < 73 > 74 75 76 77 78 79 .. 148 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed