[컴퓨터월드] [NEWS] 한국방송통신대학교 음성인식 자동 자막생성 시스템
2018.07.01
신속·정확한 자막 생성 시스템 마련
자동화된 자막 생성에서 가장 중요한 것은 정확도다. 특히 정확도 측면에서는 강의 내에서 교수가 강의하는 내용을 정확히 캐치해 텍스트로 옮기는(Speech to Text, STT) 것이 중요한데, 대학 강의의 경우 일반적으로 사용되지 않는 전문용어나 고유명사가 빈번하게 사용된다는 어려움이 있었다.
보편적인 학습 모델을 활용한 프로젝트 초기에는 자막 생성의 정확도가 80% 수준에 머무르기도 했다. 방송대 측은 자막 자동 생성 기능을 제공하고 있는 타 온라인 동영상 사이트들이 영상에 따라 자막의 정확도가 심하게 차이가 난다는 점을 지적하며, 학생들이 방송대에서 제공하는 모든 강의에 대해 정확한 자막을 제공받을 수 있어야 한다고 강조했다.
이에 따라 방송대와 코난테크놀로지는 속기사들이 수작업으로 제작했던 자막이나 학습교재와 같은 텍스트 데이터를 활용해 학습시킴으로써 자막 정확도를 높였다. 특수기호나 자막 데이터에 포함된 타임레코드를 제거하는 등 학습용 데이터를 통합하는 과정을 자동화하고, 이렇게 축적한 데이터로 학습시킨 결과 고유명사나 전문용어를 높은 확률로 잡아낼 수 있게 됐다.
여기에 코난테크놀로지가 보유한 자연어처리 기술을 적용함으로써 90~95%에 달하는 정확도를 확보했다. 남아있는 오류를 잡아내고 품질을 개선하기 위해 여전히 인력에 의한 후보정 작업을 병행하기는 하지만, 이전에 비해 훨씬 적은 인원으로 향상된 수준의 자막을 제공할 수 있게 됐다는 설명이다.
= 이하 생략 =
관련기사 바로가기(컴퓨터월드 7월호)"
이전글
[IT 조선] [NEWS] 핸디소프트, ‘지능형 협업 플랫폼’ 글로벌화 추진
2018.07.05
다음글
[KBS] [NEWS] KBS 스페셜 - 평화를 향한 첫 걸음 '북미정상회담'
2018.06.25