음질 좋은 TTS, 똑똑한 LLM을 갖췄는데도 보이스봇 통화가 자꾸 꼬인 적 있으신가요? 십중팔구 기술이 아니라 대화 설계의 문제입니다. 고객이 어떤 말을 할지 예측하고, 그에 맞는 길을 미리 깔아두는 작업이죠.
대화 시나리오 설계는 '대본 쓰기'가 아니라 '길 만들기'에 가깝습니다. 이 글에서 통화가 매끄럽게 흐르도록 설계하는 5단계를 정리해 드리겠습니다.
왜 대화 설계가 음질만큼 중요할까?
보이스봇의 성패는 '얼마나 똑똑한가'보다 '고객이 막힘없이 목적을 끝내는가'에서 갈립니다.
고객은 봇이 얼마나 좋은 AI를 쓰는지 모릅니다. 그저 "내 용건이 빨리 해결됐는가"만 기억하죠. 아무리 자연스러운 목소리라도 길을 못 찾고 같은 질문을 반복하면 즉시 이탈합니다. 대화 설계는 그 '길'을 까는 작업입니다.
1단계 — 고객 의도(Intent)부터 정의한다
먼저 고객이 전화로 하려는 일의 목록을 뽑습니다.
- 조회(배송·잔액·예약), 변경(일정·주소), 신청/해지, 단순 문의…
- 각 의도를 고객이 실제로 쓰는 표현으로 수집 ("언제 와요?"="배송 조회")
의도를 좁고 명확하게 나눌수록 봇이 헷갈리지 않습니다. 이 단계가 부실하면 뒤가 다 흔들립니다.
2단계 — 해피패스(Happy Path)를 먼저 그린다
가장 흔하고 이상적인 흐름(해피패스)을 먼저 완성합니다. 모든 예외를 처음부터 다루려 하면 미궁에 빠집니다.
예) 예약 확인 → "○월 ○일 예약 맞으세요?" → "네" → "확인됐습니다" → 종료
전체 통화의 70~80%는 이 직선 경로로 끝납니다. 해피패스를 탄탄히 만든 뒤 곁가지를 칩니다.
3단계 — 분기(Branch)와 예외를 설계한다
해피패스에서 벗어나는 길을 추가합니다.
| 상황 | 설계 |
|---|---|
| 고객이 "아니오/변경" | 변경 플로우로 분기 |
| 답이 모호함 | 재질문 1회 후 확인 |
| 범위 밖 요청 | 상담원 핸드오프 |
핵심은 '막다른 길'을 없애는 것입니다. 모든 분기는 결국 해결 또는 핸드오프로 수렴해야 합니다.
4단계 — 대화 길이와 확인 지점을 조율한다
- 확인(Confirmation): 중요한 행동(결제·취소) 전엔 반드시 한 번 되묻기
- 간결성: 한 번에 한 가지만 묻기 (복수 질문 금지)
- 진행감: "거의 끝났어요" 같은 신호로 이탈 방지
너무 짧으면 불안하고, 너무 길면 지칩니다. 그 균형을 잡는 단계입니다.
5단계 — 실제 발화로 테스트하고 다듬는다
설계는 책상이 아니라 통화에서 완성됩니다.
- 실제 사람들이 예상 밖으로 말하는 표현을 수집해 의도에 추가
- 자주 끊기는 지점(드롭오프)을 찾아 분기·멘트 수정
- 반복 개선으로 해피패스 도달률을 끌어올림
휴멜로 프로소디 AICC는 FAQ·매뉴얼을 스킬북으로 학습시키고, 위 5단계의 시나리오를 한 콘솔에서 구성·배포·개선할 수 있습니다. STT(의도 인식)·LLM(분기 판단)·DIVE TTS(자연스러운 안내)가 묶여 있어, 설계한 흐름이 실제 통화에서 매끄럽게 작동합니다.
자주 묻는 질문 (FAQ)
Q. 보이스봇 대화 시나리오 설계는 무엇부터 시작하나요? A. 고객 의도(Intent) 정의부터 시작합니다. 전화로 하려는 일의 목록을 뽑고, 고객이 실제 쓰는 표현으로 수집한 뒤 해피패스를 먼저 그립니다.
Q. 해피패스가 무엇인가요? A. 가장 흔하고 이상적인 대화 흐름입니다. 전체 통화의 70~80%가 이 경로로 끝나므로, 예외보다 해피패스를 먼저 탄탄히 설계해야 합니다.
Q. 대화가 자꾸 막다른 길로 빠지는데 어떻게 하나요? A. 모든 분기가 결국 '해결' 또는 '상담원 핸드오프'로 수렴하도록 설계해야 합니다. 막다른 길과 무한 재질문을 없애는 것이 핵심입니다.
Q. 시나리오는 한 번 만들면 끝인가요? A. 아닙니다. 실제 통화에서 고객의 예상 밖 표현과 드롭오프 지점을 수집해 반복 개선해야 도달률이 올라갑니다.
정리하며
보이스봇 품질은 음질·AI 성능만이 아니라 대화 설계에서 완성됩니다. 의도 정의 → 해피패스 → 분기 → 확인/길이 조율 → 실발화 개선의 5단계가 통화를 매끄럽게 만듭니다.
휴멜로 프로소디 AICC는 이 설계를 한 콘솔에서 구성·개선하고, STT·LLM·DIVE TTS가 한 흐름으로 작동해 설계한 대화가 실제로 흐르게 합니다.
다음 편에서는 사람처럼 자연스럽게 말을 주고받는 '턴테이킹·바지인'을 다뤄보겠습니다.
대화 흐름을 직접 짜보고 싶다면? 프로소디 콘솔에서 의도·분기를 구성해 5분 만에 첫 시나리오를 테스트해 보세요.
[관련 글 추천]
- STT(음성인식)란? · 음성 AI의 두뇌, LLM은 어떻게 의도를 이해할까



