В опорном вузе Кировской области успешно развивают it-наработки. В том числе и уникальную в своем роде систему текстового поиска по аудиофайлам. Этой работой вместе с научным руководителем Дмитрием Прозоровым занимается Александра Татаринова.
Согласитесь, было бы очень удобно найти интересующую вас конкретную фразу в свое фонотеке или рабочих аудиозаписях без перемотки, просто введя слова в строке поиска.
Кировские ученые предложили делать это не переводя речь из голосовых сообщений в текст, а наоборот, используя нейронную сеть, преобразуя поисковый запрос в фонемный образ. Получилось достаточно успешно. Последние исследования кафедры радиоэлектронных средств нашли отображение в статье, вошедшей в англоязычный сборник материалов конференции IEEE EWDTS.
Как пояснили в ВятГУ, метод может использоваться для получения данных коммерческими компаниями и государственными структурами, например, связанными с жалобами граждан, записанными на автоответичики и подобные устройства. Также алгоритм поможет вычислять возможное разглашение конфиденциальной информации во время разговора по служебному телефону.
Сейчас в вузе работают над устранением нарушений грамматической связи между словами, которые могут появляться из-за опечаток или слабого владения пользователем русским языком.
Эти исследования полностью соответствуют мировым трендам, считают в ВятГУ.