OpenAI, 차세대 음성 AI 모델 API 공개... 원하는 음성 스타일 지원

OpenAI가 개발자들을 위한 차세대 오디오 모델을 API를 통해 공개했다. 이번에 선보인 새로운 음성 모델 제품군은 더욱 강력하고 맞춤화 가능한 음성 에이전트 구축을 가능하게 한다.

이번 업데이트에서 가장 주목할 만한 점은 향상된 음성-텍스트 모델이다. 이 모델은 기존 솔루션보다 정확도와 신뢰성이 크게 개선되었으며, 특히 다양한 악센트, 소음이 있는 환경, 여러 말하기 속도 등 까다로운 상황에서도 뛰어난 성능을 보인다.

또한, 개발자들은 이제 맞춤형 텍스트-음성 모델을 활용할 수 있다. "공감적인 고객 서비스 상담원처럼 말해"와 같은 특정 방식으로 말하도록 모델에 지시할 수 있어, 더욱 다양한 응용이 가능해졌다.

OpenAI는 이번 업데이트와 함께 Agents SDK를 개선했다. 이를 통해 개발자들은 기존의 텍스트 기반 에이전트를 음성 에이전트로 손쉽게 전환할 수 있게 되었다.

새로운 오디오 모델은 저지연, 멀티모달 경험을 구축할 수 있는 Realtime API와도 통합되어 있다. 이로 인해 개발자들은 더욱 자연스럽고 반응성 높은 AI 애플리케이션을 만들 수 있게 되었다.

OpenAI는 이번 발표가 고객 지원 센터, 회의 노트 전사, 언어 학습 보조 등 다양한 분야에서 혁신을 가져올 것으로 기대하고 있다. 회사 측은 이러한 발전이 사람들과 AI 간의 더욱 자연스럽고 직관적인 상호작용을 가능하게 할 것이라고 전망했다.

현재 이 새로운 오디오 모델은 모든 개발자들이 API를 통해 사용할 수 있다. OpenAI는 앞으로도 지속적으로 이 모델들을 개선하고 확장해 나갈 계획이다.

Welaunch 김아현 기자
스타트업 뉴스 플랫폼, 위런치
© 2024 Welaunch. All Rights Reserved

보도자료/기고 : editor@welaunch.kr
광고/제휴 문의: we@welaunch.kr

Welaunch·1년 전

OpenAI, 차세대 음성 AI 모델 API 공개... 원하는 음성 스타일 지원

Welaunch
·1년 전