,

$ 102.34 106.54

ТЭК

ИИ «VK Видео» повысил качество субтитров на 25%

Платформа «VK Видео» активно использует искусственный интеллект. Внедрение новых алгоритмов позволило улучшить на 25 % технологию автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Это существенно повысило точность анализа и расшифровки.

Качеству распознавания способствует и то, что нейросети уже знают тысячи слов, среди которых немало профессиональных терминов, акронимов, имен собственных, а также ИИ понимает и мемы. Совсем скоро искусственный интеллект сможет разделять на отдельные реплики речь разных спикеров, что сделает восприятие и чтение субтитров более простым.

Для автоматического формирования субтитров применяются ML-модели – они создают текст, расставляют знаки препинания, синхронизируют полученный результат с видео. Чтобы субтитры получились максимально точными, аудиопоток обрабатывается ИИ в несколько этапов.

Первый – исключение посторонних шумов, распознавание речи и превращение ее в текст. Второй – создание читаемого текста из набора распознанных слов. Этим занимаются модели пунктуации и денормализации. На третьем этапе ИИ получившийся текст синхронизирует с аудиодорожкой. Подобная технология позволяет получить понятные и правильные субтитры и в профессиональных видео, и в любительских роликах.

За последний месяц функцию субтитров в веб-версии стали использовать активнее на 28 %. Из всей аудитории «VK Видео» субтитры включают 11 %.

Источник: CNews