Пользователи видеоконтента оценили функцию субтитров. Доля пользователей, применяющих ее на платформе «VK Видео», увеличилась на 28 % только за последний месяц. Сейчас субтитры включают при просмотре роликов 11 % от всей аудитории сервиса, который значительно улучшил качество расшифровки речи.
Повышение точности распознавания речи на 25 % на платформе «VK Видео» – результат внедрения сервисом новых алгоритмов искусственного интеллекта для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Еще один фактор – быстрое освоение нейросетями тысяч новых слов, среди которых имена собственные, профессиональные термины, акронимы и мемы. Очень скоро искусственный интеллект сможет разделять речь разных спикеров на отдельные реплики, соответственно, субтитры станут понятнее.
Создают текст, расставляют знаки препинания, синхронизируют его с видео ML-модели, с помощью которых генерируются автоматические субтитры. ИИ обрабатывает аудиопоток в несколько этапов, повышая точность анализа. Для начала нейросеть исключает посторонние шумы и превращает в текст распознаваемую речь. Затем набор распознанных слов в хорошо читаемые фразы выстраивают модели пунктуации и денормализации. В конце получившийся текст ИИ синхронизирует с аудиодорожкой.
Технология субтитров удобна для людей с нарушением слуха, а также востребована в ситуациях, когда приходится смотреть видео без звука.
Источник: CNews