Welaunch
·
3일 전
오픈AI, 실시간 음성 AI 지원…‘gpt-realtime’ 및 Realtime API 정식 출시
소식발행일
관심
9
589
태그
사이트
https://openai.com/index/introducing-gpt-realtime/
신청
구독
좋아요
공유
신청
오픈AI가 자사의 최첨단 음성 인공지능 모델 ‘gpt-realtime’과 ‘Realtime API’의 정식 출시를 공식 발표했다. 이번 업데이트는 자연스러운 대화형 AI 구축을 희망하는 개발자와 기업을 위한 강력한 생산 환경용 도구와 기능 확장을 제공해, 차세대 고객지원·개인비서·교육 등 다양한 분야에서 실시간 음성 에이전트 활용이 대폭 손쉬워질 전망이다. 이번에 선보인 ‘gpt-realtime’ 모델은 복잡한 지시와 맥락을 더 정확하게 인식하며, 한 번에 텍스트 변환 없이 오디오를 직접 처리·생성한다. 이를 통해 응답 속도를 단축하고, 인간에 가까운 억양·감정·속도까지 풍부하게 구현할 수 있게 했다. 특히 영어뿐만 아니라 여러 언어를 문장 내 자유롭게 전환하고, 번호·특수문자 등 세부 정보를 정확히 인식하는 성능도 크게 개선됐다. Realtime API에는 △MCP 서버 및 SIP 전화(외부 전화망) 연동 △이미지 입력 기능 △비동기적 함수 호출 등 새로운 지원이 추가됐다. 이전까지 음성AI의 단점이었던 고지연 문제를 ‘일체형 모델’로 근본 개선해, 실제 통화/콜센터 등 초저지연이 필수적인 환경에도 즉시 적용이 가능하다. 또 신규 음성 ‘Cedar’와 ‘Marin’을 API에 독점 제공, 총 10개 전체 목소리의 자연스러움을 한층 높였다. 요금도 기존 gpt-4o-realtime-preview 대비 20% 인하되어 경쟁력을 더했다. 오픈AI는 “실제 고객 협업을 통해 모델을 한층 정교하게 튜닝했으며, 앞으로도 사용성·신뢰성을 지속적으로 강화해 나갈 것”이라고 밝혔다. 업계 전문가들은 “AI와 목소리로 실시간으로 소통하는 미래형 서비스의 대중화가 한층 앞당겨질 것”이라고 전망했다. Welaunch 김아현 기자 스타트업 뉴스 플랫폼, 위런치 © 2024 Welaunch. All Rights Reserved 보도자료/기고 : editor@welaunch.kr 광고/제휴 문의: we@welaunch.kr
Welaunch
다른소식
더보기