KONAN TECHNOLOGY

Deep Speech Konan Voice

Konan Voice를
사용해야 하는 이유

코난테크놀로지와 음성합성 솔루션이 만났다!
텍스트가 자동으로 음성파일로 변환되는
차세대 음성합성 솔루션 Konan Voice로
다양한 비즈니스 가치를 창출해 보세요.

Konan Voice는 단일 신경망 기술을
사용하여 입력된 텍스트로부터 해당
음성파형을
실시간 자동으로 합성하는
고품질 고속 end-to-end 음성합성
솔루션
입니다.

BENEFITS

Benefit 01.

차별화된 음성합성 솔루션 제시

한국어 텍스트가 음성으로 변환되며 한국어 외에도 영어, 숫자, 기호 등의 텍스트 및 다양한 표본화와 양자화 포맷의 음성 파형도 지원됩니다.


Benefit 02.

혁신적 음성합성 서비스 실현

남녀 합성음 선택 기능을 제공하고, 낭독체 및 대화체 합성도 지원됩니다.
또한 평서문, 의문문, 감탄문, 띄어읽기 합성 및 다양한 음색과 억양의
남녀 음성 페르소나도 지원돼 선택군이 다양합니다.


Benefit 03.

발성 속도 조절

보통 발성 속도 대비 빠르거나 느린 합성음을 지원하며,
발성 속도 또한 점진적으로 조절할 수 있습니다.

FEATURE

Konan Voice는 고품질 단일화자 음성합성 엔진은 '현직 아나운서', '성우' 등 음성 발성 전문가로부터 녹음된
고품질의 대용량 단일화자 음성데이터를 학습에 사용하고, 음성 지속시간 모델과 비순환 신경망 기반
고속 end-to-end 음성합성 기술을 적용하여 인간이 발성한 음성 수준의 고품질 합성음을 CPU 상에서
실시간으로 제공
합니다.

또한 다화자 다음색 음성합성 엔진은 고품질 고속 end-to-end 음성합성 기술과 화자 임베딩 기술을 결합하여
재학습 없이 화자 정보만으로 개별 화자 고유의 음색과 발음 스타일 등이 생생하게 표현된 고품질 페르소나 음성을
실시간으로 합성
할 수 있습니다.

고품질 End-to- end 음성합성

  • 학습 데이터로부터 음성합성 규칙을 자체적으로 학습하여 음성을 합성하는 단일 신경망 모듈 기반의 최신 end-to-end 음성합성 기술 적용
  • 음성 운율 모델링 기술 적용으로 보다 자연스러운 음질 확보
  • 인간 발성 음성 수준의 고품질 합성음 제공

고완성도 음성합성

  • 음성 지속시간 모델링 기술 적용으로 end-to-end 음성합성 기술의 불안정한 합성오류 문제 해결
  • 완벽한 상용 서비스를 위한 고완성도 음성합성
    기능

CPU 기반 고속 음성합성

  • 전체 신경망 모듈을 비순환, 비재귀 방식의 고속 트랜스포머 알고리즘으로 설계
  • GPU 없이 CPU 상에서도 실시간 합성음 제공

다양한 음색 및 음성스타일

  • 현직 아나운서 등 남녀 음성 발성 전문가들로부터 수집한 고품질 대용량 음성데이터로 신경망 학습
  • 낭독체 및 대화체 합성음 지원
  • 수십 명 수준의 다화자 다음색 합성음 선택을 통한 음성 페르소나 지원 (Upcoming)

TECHNOLOGY

개념도 - Konan Voice

개념도 - Konan Voice

Talk to KONAN

제품에 대해 궁금하신 사항이 있으신가요?