Методы цифровой обработки сигналов реализовывают модернизацию, очистку и обновление звукового сигнала в цифровой формат данных и другие, которые будут обрабатываться системой распознавания речи. Также эти задачи осуществляют фильтрацию шумовых помех. Методы распознавания используют при выделении и соединение отдельных слов или предложений текста [1].
Системы синтеза речи охватывают часть лингвистики, которая включает в себя концепцию и принципы понимания языка и распознавания речи.
Технология синтеза речи широко используется для пользователей, которые имеют проблемы со зрением. Для остальных пользователей система существенно снижает нагрузку на зрение, нервную систему, позволяя задействовать слуховую память [1].
Каждый текст состоит из букв, которые соединены в слова, обособленны пробелами и знаками препинания. Интонация фразы зависит от знаков препинания. Чтобы синтезированная речь звучала натурально, необходимо создать естественности голоса на уровне плавности звучания и интонации, а так же правильную расстановку ударений [2].
Обычно системы синтеза речи разделяют на два группы:
- системы, зависимые от диктора, такие системы требуют полной перенастройки при работе с другим диктором;
- системы, которые не зависят от диктора.
Первыми на рынке появились системы первого типа. В них звуковой образ команды хранился в виде целого образа. При сравнения неизвестного произнесения и образа команды использовались методы динамического программирования. Эти системы исправно работали при распознавании небольших ограниченных из 10-30 команд и воспринимали одного диктора. При работе с другим диктором системы требовали глубокой перенастройки [2].
Для того чтобы понимать слитную речь, нужно было переходить к словарям значительно больших размеров. Методы которые использовались в системах первого вида, не подходили для решения этой задачи, так как невозможно создать эталоны для такого количества слов [2]. Поэтому второй вид систем наиболее удачный, позволяет реализовывать различные задачи.
Существуют разные методы построения моделей речевых сигналов Основных подходов к созданию математических моделей речевых сигналов, пять:
- линейное прогноз речевого сигнала; ограничением данного подхода выступает малое время предсказания;
- решение дифференциальных уравнений;
- гармоническая математическая модель речевого сигнала;
- математическая модель речевого сигнала в виде ряда отрезков функций;
- генерирование математической модели речевого сигнала в виде функциональной временной зависимости, сформированной на теории модуляции [3].
Высокое качество синтезированной речи напрямую зависит от точности речевой модели, которая описывает речевой сигнал. Минимальные требования, предъявляемые к выбору модели, наименьшее количество коэффициентов все эти требования способствует уменьшению систематической ошибки и времени обработки поступивших данных.
Библиографический список
- Математические методы описания речевых сигналов (корреляционные и спектральные характеристики, функция распределения, пик-фактор) [Электронный ресурс] Режим доступа: http://r.bookap.info/work/168141/Matematicheskie-metody-opisaniya-rechevyx (дата обращения: 17.02.2017)
- Математические методы описания речевых сигналов [Электронный ресурс] Режим доступа: http://bibliofond.ru/view.aspx?id=802109 (дата обращения: 17.02.2017)
- Обработка речевых сигналов [Электронный ресурс] Режим доступа: http://knоwledge.allbest.ru/prоgramming/3c0b65635b3ac78b5d53a88421216d37_0.html (дата обращения: 15.02.2017).