1시간 넘는 보이스 데이터 확보는 이제 잊으세요.
1분 보이스 데이터로 한국어/영어 보이스 생성
휴멜로의 보이스 기술 샘플
FRTTS는 Transformer 모델 기반의 Deep-Nuetral-Network (DNN) 모델입니다.
높은 퀄리티의 음질이 구현 가능한 자체 개발 엔진으로, 휴멜로에서 자체적으로 발전시킨 Foundation 모델입니다.
의미 기반 띄워읽기 등 자연스러운 발화가 가능하며, 영어와 한글의 혼용 등 어떠한 상황에서도 발화 가능합니다.
세계 최고 수준의 휴멜로 보이스 초해상도화 기술을 직접 듣고 판단해보세요
평범하지 않은 고음역대의 캐릭터 목소리, 저음의 배우 독백과 같은 특이한 보이스 복제도 가능합니다.
1분 보이스 데이터의 음색을 완벽하게 복제하여 TTS로 구현이 가능합니다.
업계 평균 24시간 초과되는 학습시간을 대폭 줄였습니다.
WAV, MP3, PCM, U-LAW, samplerate 및 bitrate 등의 다양한 오디오 포맷을 지원합니다.
30자 기준으로 보이스 0.3초 이하 지연시간이 발생되어 지연비용을 확 줄이세요.
고품질 오디오 지원 (업샘플러)
저음질의 보이스를 고음질의 풍성한 보이스으로 표현하세요.