OpenAI, 알아서 일을 해주는 새로운 AI 에이전트 ‘Operator’ 출시
- 사이트
https://operator.chatgpt.com/
OpenAI가 새로운 AI 에이전트 ‘Operator’를 발표하며, 웹을 통해 독립적으로 작업을 수행할 수 있는 AI 시스템의 새로운 가능성을 열었다. 현재 연구 프리뷰 상태로 제공되는 Operator는 사용자 피드백을 기반으로 점차 발전할 예정이다.
■ Operator의 주요 기능
Operator는 사용자 지정 작업을 자동화하여 반복적인 웹 작업을 효율적으로 처리할 수 있도록 돕는다. 예를 들어, 양식 작성, 장보기, 밈 생성 등의 작업을 수행할 수 있다. 이 AI 에이전트는 브라우저를 통해 웹 페이지를 보고, 클릭하고, 스크롤하며, 타이핑하는 등 사람과 유사한 방식으로 상호작용한다.
현재 Operator는 미국 내 ChatGPT Pro 사용자에게 제공되며, 향후 Plus, Team, Enterprise 사용자로 확대될 예정이다. 또한, ChatGPT와 통합되어 더 넓은 사용 환경을 지원할 계획이다.
■ Operator의 작동 원리
Operator는 OpenAI가 새롭게 개발한 모델 ‘Computer-Using Agent(CUA)’를 기반으로 작동한다. CUA는 GPT-4의 시각적 기능과 강화 학습 기술을 결합해 그래픽 사용자 인터페이스(GUI)와 상호작용하도록 훈련된 모델이다. 이 모델은 특수한 API 없이도 스크린샷을 통해 웹 페이지를 ‘보고’, 마우스와 키보드로 동작하며 작업을 수행한다.
또한, 문제 해결 과정에서 실패 시 스스로 교정을 시도하거나, 사용자가 직접 작업을 제어할 수 있도록 지원한다.
■ 사용자 맞춤화와 안전성 강화
사용자는 Operator를 통해 자신만의 작업 흐름을 설정할 수 있다. 예를 들어, Booking.com에서 항공사 선호도를 저장하거나 Instacart에서 장보기 리스트를 자동화할 수 있다. 여러 작업을 동시에 처리하는 멀티태스킹 기능도 지원한다.
안전성과 개인정보 보호는 Operator의 핵심 우선 사항이다. 이를 위해 다음과 같은 안전 장치가 적용된다:
• Takeover 모드: 중요한 정보를 입력할 때는 사용자가 직접 제어.
• 사용자 확인: 중요한 작업은 사용자의 승인을 거쳐 실행.
• 작업 제한: 은행 거래와 같은 고위험 작업은 제한.
사용자는 개인정보 보호를 위해 데이터가 모델 훈련에 사용되지 않도록 설정할 수 있으며, 간편하게 로그아웃하거나 데이터를 삭제하는 기능도 제공된다.
■ 제한 사항과 향후 발전
현재 Operator는 초기 연구 단계로, 복잡한 작업(예: 슬라이드쇼 생성, 일정 관리)에서 아직 완벽하지 않다. 사용자 피드백은 정확성과 신뢰성 개선에 중요한 역할을 할 전망이다.
OpenAI는 Operator의 기능을 확장하고 개인과 기업 모두에 새로운 디지털 경험을 제공하기 위해 지속적으로 기술을 발전시킬 계획이다. Operator는 AI가 디지털 생태계에서 중요한 역할을 할 수 있음을 보여주며, 웹 기반 작업의 효율성을 혁신적으로 변화시킬 가능성을 지니고 있다.
Welaunch 김아현 기자
스타트업 뉴스 플랫폼, 위런치
© 2024 Welaunch. All Rights Reserved
보도자료/기고 : editor@welaunch.kr
광고/제휴 문의: we@welaunch.kr