Кодирование речи

  • Просмотров 552
  • Скачиваний 30
  • Размер файла 34
    Кб

Кодирование речевой информации Вступление Необходимость кодирования речевой информации возникла не так давно, но на сегодняшний момент, в связи с бурным развитием техники связи, особенно мобильной связи, решение этой проблемы имеет большое значение при разработке систем связи. Огромное распространение в наше время получили бытовые радиотелефоны. Они позволяют пользователю не быть привязанным к одному месту в течении

телефонного разговора, нет необходимости стремглав мчаться к телефону, услышав звонок (если, конечно, вы вообще его звонок услышите). К тому же во многих моделях существуют различные удобства для пользователя: связь между трубкой и базовым аппаратом, громкая связь (хороша в случае, когда “сели” аккумуляторы в трубке). По всем вышеперечисленным преимуществам эти аппараты завоевали большую популярность и получили большое

распространение. Но поскольку аппаратов стало много, то возникла проблема определения “свой-чужой”, а поскольку обмен данными между трубкой и базовым аппаратом ведется на радиочастотах (27 МГц, 900 МГц),разговор по радиотелефону можно легко подслушать, появилась необходимость кодирования (или шифрования) речевой информации. Сразу необходимо оговориться, что речевая информация принципиально отличается от другого вида - текстов

(рукописных и в электронном виде). При шифровании текста мы имеем дело с ограниченным и определенно известным нам набором символов. Поэтому при работе с текстом можно использовать такие шифры, как шифры перестановки, шифры замены, шифры взбивания и т.д. Речь же нельзя (во всяком случае на сегодняшнем уровне развития технологи распознавания речи)представить таким набором каких-либо знаков или символов. Поэтому применяются

другие методы, которые, в свою очередь, делятся на аналоговые и цифровые. В настоящее время больше распространены цифровые методы, на них- то мы и остановимся. Принцип цифрового кодирования заключается в следующем: аналоговый сигнал от микрофона подается на АЦП, на выходе которого имеем n-разрядный код (при подборе хорошей частоты дискретизации пользователь на другом конце линии может и не догадаться, что голос его собеседника