В НИУ ВШЭ пояснили, что он поможет нейросетям лучше распознавать эмоции и потенциально диагностировать заболевания
Читайте ТАСС вЯндекс.НовостиЯндекс.Дзен…Показать скрытые ссылки
ТАСС, 2 ноября. Российские математики разработали алгоритм, который позволяет очень точно и быстро замерять высоту речи, так называемую частоту основного тона, в том числе при высоком уровне фонового шума и при малом количестве вычислительных ресурсов. Этот подход поможет нейросетям лучше распознавать эмоции и речь человека, сообщила в четверг пресс-служба НИУ ВШЭ.
"Исследователи представили новый алгоритм, который позволяет точно измерять частоту основного тона речи – важного параметра для распознавания эмоций и диагностики заболеваний. Предложенный подход работает даже в условиях шума и без задержки во времени, при этом задействует меньше вычислительных ресурсов, чем известные аналоги", – говорится в сообщении.
Алгоритм был разработан группой научной группой под руководством профессора НИУ ВШЭ в Нижнем Новгороде Андрея Савченко. Он построен на базе доработанных классических математических методов, в том числе преобразования Фурье, которые применяются при обработке звука компьютерными программами.
Эти классические подходы, как объясняют ученые, значительно теряют в точности работы, если сигнал записан при высоком уровне фонового шума или при помощи некачественного микрофона. Авторы работы выяснили, что обрабатываемый сигнал можно очистить от помех при помощи созданной ими простой однослойной нейросети, способной отделять звуки речи от "белого шума".
По словам исследователей, созданный ими алгоритм может применяться во множестве областей, в том числе при разработке голосовых помощников, способных распознавать речь и эмоции владельца, а также в области психологии и медицины. Например, определение высоты голоса может помочь выявлять патологии голоса при диагностике нейродегенеративных заболеваний.