Средства мультимедиа — страница 6
- Категория Компьютеры и устройства
- Раздел Рефераты
- Просмотров 14160
- Скачиваний 831
- Размер файла 141 Кб
(которые, кстати, существенно меньше меняются со временем, чем внешность человека). Цель систем идентификации по образцу речи — идентифицировать конкретного известного системе пользователя и выявить самозванца. Взаимодействие пользователя с системой идентификации состоит из трех этапов: . * регистрации пользователя с целью запоминания особенностей его голоса и формирования для него речевой модели; * тестирования, во время которого выполняется сравнение поступившего образца речи с запомненной речевой моделью пользователя, а также возможное выявление модели самозванца из базы моделей голосов множества прочих людей; * допуска к работе в системе, если тестирование прошло успешно и пользователь назвал верный пароль. Механизм распознавания речи Механизм распознавания речи состоит обычно из четырех основных блоков: · препроцессора; · экстрактора; · компаратора; · интерпретатора. Препроцессор или модуль сбора данных обеспечивает приведение речевого сигнала к наиболее качественному виду (производится автоматическая регулировка усиления, подавление эхо-сигнала, фиксация наличия или отсутствия речи и интонационного конца фразы ). Экстрактор выполняет спектральный анализ сигнала. Акустическо-фонетический поток звуков разбивается на короткие кадры (длительностью примерно по 10 мс) и выявляются спектральные характеристики каждого кадра. Компаратор выполняет акустическое сравнение выявленных характеристик каждого кадра с имеющимися акустическо-фонетическими образцами. Сравнение производится на уровнях выявления контекстно-независимых фонем, контекстно-зависимых фонем и моделей слов. Интерпретатор решает задачу наилучшего разбиения полученного компаратора «алфавитного» потока на слова и фразы. Системы синтеза речи Системы речевого вывода информации базируются либо на выборке из словаря готовых оцифрованных звуковых последовательностей, либо на синтезаторах речи. Самым простым вариантом является выборка готовых звуковых последовательностей (как в автоответчике), но ввиду большого размера «звуковых» файлов, вывод большого числа слов в этом случае практически невозможен. В таких простых системах часто используются меню, по которым пользователь может выбрать те высказывания, которые он бы хотел услышать. При наличии нужных записей в базе данных их текст озвучивается. Такие системы используются, например, в будильниках, в автомобильных навигационных системах.
Похожие работы
- Доклады
- Рефераты
- Рефераты
- Рефераты
- Контрольные