CNET Korea뉴스비즈니스

수퍼톤, AWS 서밋 서울서 AI 가창·더빙 신기술 선보여

콘텐츠 넘어 일상 속으로…이교구 대표 'AI 음성 기술 대중화 선도하겠다'

성두용 수퍼톤 연구개발실장이 지난 15일 서울 코엑스에서 열린 'AWS 서밋 서울 2025' 기조연설에서 발표하고 있다. (사진=수퍼톤)

(씨넷코리아=김진아 기자) AI 오디오 기업 수퍼톤이 지난 14~15일 열린 ‘AWS 서밋 서울 2025(AWS Summit Seoul 2025)’에서 AI기반 듀엣 무대와 기조연설 한국어 더빙, 장내 안내 방송 송출까지 다채로운 음성 AI 기술을 선보여 참석자들의 호평을 받았다고 16일 밝혔다. AI기반 음성임을 알아채지 못할 만큼 기술적 완성도가 높다는 반응과 함께 콘텐츠 창작 도구를 넘어 생활 밀착형 기술로서의 가능성도 높게 평가받았다.

AWS 서밋 서울 첫날 기조연설을 앞두고 펼쳐진 ‘컨트롤 유(Ctrl+U)’ 무대에서는 수퍼톤의 가창 합성 기술(Singing Voice Synthesis)이 주목을 받았다. 컨트롤 유(Ctrl+U)는 포자랩스가 음악 생성 AI 모델로 작사, 작곡한 노래다. 1절에서는 AWS와 딩고 뮤직이 기획한 ‘AI 뮤직 챌린지’ 참가자들이 함께 등장한 가창 영상이 재생됐는데, 수퍼톤이 만든 남성의 AI 보이스가 코러스로 참여했다. 2절에서는 AI 보이스가 챌린지에서 우승한 여성 가창자와 함께 무대를 꾸몄다. 댄서들과 무대에 오른 여성 가창자는 AI 보이스와 자연스럽게 노래를 주고받았고, 마치 실제 남녀가 듀엣곡을 부르는 것 같은 자연스러운 하모니를 연출했다.

둘째 날에는 성두용 수퍼톤 연구개발실장이 기조연설 무대에 올라 ‘음성 콘텐츠 창작 경험을 혁신하는 수퍼톤 보이스 AI’를 주제로 발표했다. 성 실장은 AWS의 아마존 세이지메이커(Amazon SageMaker)를 이용해 자체 개발한 TTS(Text-to Speech) 기술 기반의 AI 음성 서비스 ‘수퍼톤 플레이’를 비롯해, 이번 행사에서 데모 버전으로 처음 선보인 AI 더빙 기술 등을 소개했다. 이 자리에서 성 실장은 수퍼톤의 여러 기술들이 산업의 경계 없이 다양한 콘텐츠 제작 영역에 널리 활용될 수 있다는 자신감도 내비쳤다.

특히, AI 더빙 기술은 같은 날 기조연설에서 버너 보겔스 아마존 부사장 겸 최고기술책임자(CTO)와 디팍 싱 AWS 차세대 개발자 경험 부문 부사장의 발표 영상에 활용되며 관객들의 이목을 집중시켰다. AI 더빙 기술은 영상 속 화자의 목소리를 그대로 더빙해주는 기술로, 수퍼톤 플레이 등 여러 AI 음성 기술을 기반으로 개발됐다. 이번 더빙 영상을 위해 수퍼톤은 사전 녹화된 보겔스 CTO와 싱 부사장의 발표 영상 속 영어 목소리를 ‘보이스 클로닝’으로 추출해 활용했다. 실제 영상 후반부를 수퍼톤의 기술들을 적용해 한국어로 발표하게 만듬으로써 두 연사가 한국어를 유창하게 구사하는 듯한 착각을 불러일으켰다.

행사의 원활한 진행을 위한 장내 안내 방송에도 수퍼톤의 기술이 적용됐다. 수퍼톤 플레이에서 제공하는 200여 개의 목소리 캐릭터 중 안내 방송에 적합한 ‘에디(Eddie)’와 ‘수호(Suho)’의 음성으로 관람객 대상 입·퇴장 및 발표 세션 안내, 연사 소개 등 각종 멘트가 송출됐다.

이 밖에 수퍼톤 플레이와 그 적용 사례를 직접 체험해볼 수 있는 각종 부스에는 관람객들의 발걸음이 이어졌다. 수퍼톤 부스에는 수퍼톤 플레이와 AI 음성 답변 서비스 ‘캐릭터 챗’이 마련됐고, 골프존 부스에는 수퍼톤 플레이로 생성한 음성으로 골프 코칭을 해주는 ‘나만의 골프 코치’를 선보여 눈길을 끌었다.

이교구 수퍼톤 대표는 “이번 AWS 서밋 서울에서 수퍼톤의 여러 신기술들이 실생활까지 다양하게 활용할 수 있다는 것을 보여줄 수 있었다”며 “앞으로도 AI 오디오 업계 선두주자로서 AI 음성 기술의 대중화를 선도해 나가겠다”고 말했다.