
▲일레븐랩스(ElevenLabs) 창립자 마티 스타니셰프스키 CEO가 오디오 에이전트 플랫폼의 비전과 혁신을 밝히고 있다.
TTS·STT 모델 글로벌 대기업 성능 능가, 다양한 오디오 생성·조합
네이버·LG유플러스 등 협력 한국어 발음 및 억양 최적화 모델 개발
일레븐랩스(ElevenLabs)가 오디오 에이전트 플랫폼으로 한국에서 보이스 AI 혁신의 새로운 장을 연다.
일레븐랩스는 21일 JW 메리어트 호텔에서 기자간담회를 열고 한국 시장에 본격 진출한다고 밝혔다.
이날 행사에서는 창립자 마티 스타니셰프스키(Mati Staniszewski) CEO가 직접 방한해 직접 오디오 에이전트 플랫폼의 비전과 혁신을 밝혔다.
마티 스타니셰프스키 CEO는 “일레븐랩스는 연구와 제품이 통합된 독특한 구조를 갖고 있다”며 “자체 개발한 오디오 AI 모델을 기반으로 실제 시장에 적용 가능한 다양한 제품을 선보이고 있다”고 밝혔다.
일레븐랩스의 텍스트-음성 변환(TTS)과 음성-텍스트 변환(STT) 모델은 글로벌 대기업을 능가하는 성능을 자랑하며, 음악과 효과음, 다양한 오디오 요소를 생성·조합하는 기술도 갖추고 있다.
특히 일레븐랩스의 에이전트 플랫폼은 STT(이해), LM(지능), TTS(발화) 등 핵심 AI 모델이 하나의 플랫폼에서 유기적으로 작동한다.
기존 정보 시스템과 연동해 실제 업무에 적용할 수 있고, 에이전트의 동작을 실시간으로 테스트·모니터링하며 지속적으로 개선하는 구조다.
실제 적용 사례도 주목받고 있다.
유럽의 대형 은행에서는 일레븐랩스의 AI 에이전트가 고객 문의 전화를 자동으로 응대해 평균 처리 시간을 15분에서 2분으로 단축시켰고, 전체 문의의 50%를 AI가 해결하며 고객 만족도를 크게 높였다.
한국 시장 진출에 대해서도 마티 스타니셰프스키 CEO는 “네이버, LG유플러스 등과 협력해 한국어 발음과 억양에 최적화된 모델을 개발했다”며 “크래프톤, SBS 등 국내 혁신 기업들이 빠르게 기술을 도입하고 있다”고 밝혔다.
또한 한국 시장 진출 초기에는 영화, 방송, 콜센터 등 B2B 시장을 중심으로 영업을 하겠다고 전했다.
이를 위해 일레븐랩스는 로컬 엔지니어링 팀을 구축해 고객 맞춤형 솔루션을 제공할 계획이다.
마티 스타니셰프스키 CEO는 “음성과 스피치가 인간과 기술의 인터랙션에서 가장 근본적인 방식이 될 것”이라며, 언어 장벽이 사라지고 AI와 음성이 일상 곳곳에 스며드는 미래를 전망했다.
또한 교육, 업무, 고객 경험 등 다양한 분야에서 개인 맞춤형 지식과 초지능이 제공될 것이라는 비전도 제시했다.