업계를 압도하는 속도와
퀄리티를 갖춘 기업 전용의 보이스클로닝!
10만 시간 이상의 학습 데이터와 독자적인 딥러닝 기술로 가장 자연스러운 보이스 클로닝 경험을 제공합니다.
01
10만 시간 학습 데이터
대량 학습된 데이터를 활용해 출력하고자 하는 텍스트의 문맥을 알아서 이해하여 보이스클로닝 된 목소리도 자연스럽게 감정을 입혀줍니다.
02
대본 없이 음색과 감정 표현을 쉽게 복제
대량 학습된 데이터를 활용해 출력하고자 하는 텍스트의 문맥을 알아서 이해하여 보이스클로닝 된 목소리도 자연스럽게 감정을 입혀줍니다.
03
Cross-lingual 음성합성
한국어 화자의 음성 2초 원본만 있으면 화자의 음색만 따라해 유창한 영어 음성합성이 가능하고 반대로 영어화자의 음성 2초 원본으로 유창한 한국어 음성합성이 가능합니다.
04
실시간 보이스 생성
30자 기준 0.3초 이하 지연시간으로 실시간 생성을 보장합니다. 빠른 응답이 필요한 AICC, 콜봇 환경에 최적화되어 있습니다.
05
48kHz 스튜디오급 음질
휴멜로 DIVE의 모든 음성은 48kHz로 업샘플러가 되어 스튜디오급 음질을 제공해 또렷하고 선명한 품질을 보장합니다.
06
목소리 특징 자유 조절
발화 속도, 높낮이, 음량 등을 딥러닝 모델로 자연스럽게 조절
07
다양한 오디오 포맷
WAV, MP3, PCM, U-LAW 등 다양한 포맷과 설정 지원
08
커스텀 단어장
단어장 기능을 통해 어떠한 단어도 원하는 방식대로 음성출력
