Разработка центра Российской академии наук
Санкт-Петербургский Федеральный исследовательский центр Российской академии наук (СПб ФИЦ РАН) представил новую разработку – нейросеть, способная понимать речь, основываясь лишь только на движениях губ. Пока что программа распознает только русский язык. Алгоритм стал первым в мире искусственным интеллектом, понимающим русский язык. Приложение будет доступно на телефонах с любой операционной системой.
Главной целью проекта являлось создание безбарьерной среды для голосовых помощников – пока что распознавать речь пользователя при шуме тяжело. Тем не менее, в ходе разработки выяснилось, что программа будет полезна для водителей (в том числе и дальнобойщиков), пилотов, сотрудникам промышленных предприятий и так далее.
При работе нейросеть ориентируется не только на визуальную составляющую, но и на аудиозапись. Искусственный интеллект улучшает изначальные данные и совмещает обе части в одну, получая наиболее аккуратную версию речи.
Известно, что проводились испытания, оценивающие точность распознавания речи. Водители грузовиков установили программу на свои телефоны. Результаты приятные: если искусственный интеллект ориентируется только на визуал, то определяет сказанное с точностью до 80%, а если совмещает картинку и аудио, то угадывает слова вплоть до 90%.
Санкт-Петербургский Федеральный исследовательский центр Российской академии наук (СПб ФИЦ РАН) представил новую разработку – нейросеть, способная понимать речь, основываясь лишь только на движениях губ. Пока что программа распознает только русский язык. Алгоритм стал первым в мире искусственным интеллектом, понимающим русский язык. Приложение будет доступно на телефонах с любой операционной системой.
Главной целью проекта являлось создание безбарьерной среды для голосовых помощников – пока что распознавать речь пользователя при шуме тяжело. Тем не менее, в ходе разработки выяснилось, что программа будет полезна для водителей (в том числе и дальнобойщиков), пилотов, сотрудникам промышленных предприятий и так далее.
При работе нейросеть ориентируется не только на визуальную составляющую, но и на аудиозапись. Искусственный интеллект улучшает изначальные данные и совмещает обе части в одну, получая наиболее аккуратную версию речи.
Известно, что проводились испытания, оценивающие точность распознавания речи. Водители грузовиков установили программу на свои телефоны. Результаты приятные: если искусственный интеллект ориентируется только на визуал, то определяет сказанное с точностью до 80%, а если совмещает картинку и аудио, то угадывает слова вплоть до 90%.