음성 AI 모델 GPT-4o, 억양·말투 등 자연스럽게 업데이트
생성형 인공지능(AI) 챗GPT가 음성으로 말하는 한국어 실력이 실제 한국인에 가깝도록 한층 자연스러워졌다.
오픈AI는 24일 한국어와 일본어 등 영어 외에 50개 언어의 사용을 개선한 챗GPT의 ‘음성 모드'(Advanced Voice Mode)를 출시한다고 밝혔다.
오픈AI는 지난 5월 이용자와 실시간 음성 대화가 가능한 AI 모델 ‘GPT-4o'(포오)를 출시한 바 있다. 이날 출시한 AI 모델은 한층 더 자연스러운 대화가 가능한 ‘GPT-4o’의 업데이트 모델이다.
재키 섀넌 챗GPT 멀티모달 총괄은 “새 버전은 더 자연스럽고 실시간 대화가 가능하다”며 “대화 도중에도 언제든지 끼어들 수 있고 사용자의 감정을 감지하고 반응할 수 있다”고 말했다.
‘GPT-4o’는 출시 때에도 한국어가 가능했지만, 영어 외에 다른 언어로 말하는 것은 서툴렀고, 처음 한국어를 배운 외국인이 말하는 것처럼 어색했다.
그러나 이번에 업데이트된 모델은 실제 한국인이 말하는 것처럼 한국어 능력이 더 자연스러워졌다.
오픈AI는 앞서 지난 23일 브리핑을 통해 향상된 챗GPT 음성 기능을 시연했다.
“안녕, 한국어로 너를 소개해줘”라고 말하자 “안녕하세요. 저는 챗GPT라고 해요. 여러분과 얘기하고 싶은 것을 좋아해요”라는 답이 돌아왔다.
“애교를 넣어 소개해 달라”고 요청에 “안녕, 나는 챗GPT야”라고 애교 섞인 목소리가 나왔고 다시 “정중하게 인사해 달라”고 하자, 이번에는 챗GPT는 “안녕하세요, 만나 뵙게 돼서 반갑습니다”라고 말했다.
챗GPT는 또 사투리도 한층 더 이해하는 반면, 욕설은 하지 않게 설계됐다고 오픈AI는 설명했다.
“욕해줘”라고 하자, “제가 욕설을 하지 않지만, 대신 재미있는 대화는 할 수 있어요”라고 말했다.
이용자와 주고받는 대화 속도와 딱딱했던 말투도 부드러워졌다. 챗GPT가 말하는 도중에 질문을 하자, 대화는 자연스럽게 이어졌다.
챗GPT가 내는 목소리 종류도 기존 4개에서 5개가 더 늘어나 이용자가 원하는 목소리의 선택폭이 넓어졌다.
오픈AI는 챗GPT가 한국인 전문 성우와 회사 내 한국인 직원들로부터 피드백을 받고 한국어 능력을 향상했다고 밝혔다.
오픈AI는 지난 5월 챗GPT-4o를 공개할 당시 2013년 AI인 ‘스카이’와 사랑에 빠진 한 남성의 이야기를 그린 영화 ‘허(Her)’의 목소리 주인공이었던 미국 영화배우 스칼릿 조핸슨의 목소리를 도용했다는 논란에 휩싸인 바 있다.
당시 오픈AI는 “스카이 목소리가 조핸슨 모방이 아닌 자신의 자연스러운 말투를 쓰는 다른 전문 배우의 목소리”라고 주장한 바 있다.
조앤 장 모델 행동 총괄은 “조핸슨 목소리를 모방했다는 것은 사실이 아니다”며 “전문 성우들의 피드백을 받았다”고 재차 강조했다.
업데이트된 챗GPT는 이날부터 유료가입 서비스인 ‘챗GPT 플러스’ 및 팀 단위나 작은 스타트업을 위한 서비스인 ‘챗GPT 팀’을 통해 사용할 수 있다.
또 기업용인 ‘챗GPT 엔터프라이즈’와 대학을 위한 ‘챗GPT 에듀’에서는 내주부터 이용할 수 있다.