Средства мультимедиа — страница 6

  • Просмотров 14160
  • Скачиваний 831
  • Размер файла 141
    Кб

(которые, кстати, существенно меньше меняются со временем, чем внешность человека). Цель сис­тем идентификации по образцу речи — идентифицировать конкретного известно­го системе пользователя и выявить самозванца. Взаимодействие пользователя с си­стемой идентификации состоит из трех этапов: . * регистрации пользователя с целью запоминания особенностей его голоса и фор­мирования для него речевой модели; * тестирования, во

время которого выполняется сравнение поступившего образ­ца речи с запомненной речевой моделью пользователя, а также возможное вы­явление модели самозванца из базы моделей голосов множества прочих людей; * допуска к работе в системе, если тестирование прошло успешно и пользователь назвал верный пароль. Механизм распознавания речи Механизм распознавания речи состоит обычно из четырех основных блоков:

·         препроцессора; ·         экстрактора; ·         компаратора; ·         интерпретатора. Препроцессор или модуль сбора данных обеспечивает приведение речевого сигна­ла к наиболее качественному виду (производится автоматическая регулировка усиления, подавление эхо-сигнала, фиксация наличия или отсутствия речи и ин­тонационного конца фразы ).

Экстрактор выполняет спектральный анализ сигнала. Акустическо-фонетический поток звуков разбивается на короткие кадры (длительностью примерно по 10 мс) и выявляются спектральные характеристики каждого кадра. Компаратор выполняет акустическое сравнение выявленных характеристик каж­дого кадра с имеющимися акустическо-фонетическими образцами. Сравнение про­изводится на уровнях выявления контекстно-независимых фонем,

контекстно-за­висимых фонем и моделей слов. Интерпретатор решает задачу наилучшего разбиения полученного компаратора «алфавитного» потока на слова и фразы. Системы синтеза речи Системы речевого вывода информации базируются либо на выборке из слова­ря готовых оцифрованных звуковых последовательностей, либо на синтезато­рах речи. Самым простым вариантом является выборка готовых звуковых последовательностей (как в

автоответчике), но ввиду большого размера «зву­ковых» файлов, вывод большого числа слов в этом случае практически невоз­можен. В таких простых системах часто используются меню, по которым пользо­ватель может выбрать те высказывания, которые он бы хотел услышать. При наличии нужных записей в базе данных их текст озвучивается. Такие системы используются, например, в будильниках, в автомобильных навигационных сис­темах.