위런치 로고

Welaunch
Welaunch
·

원라인에이아이, 한국 최초의 추론 특화 한국어 AI 모델 'OLAF v2' 공개

소식발행일
 
관심
0
550
태그
사이트
https://www.onelineai.com
구독
좋아요
공유
신청
원라인에이아이(대표 정한얼)가 한국 최초로 추론 특화 한국어 AI 모델 ‘OLAF v2’를 21일 공개했다. 이 모델은 OpenAI o1의 핵심 기술인 ‘생각 프로세스’와 ‘테스트 시간 스케일링’을 기반으로 개발되었으며, 기존 AI 모델들이 단순히 답변을 생성하는 것과 달리 더 정확한 답을 도출하기 위해 다양한 접근 방식과 사고 과정을 거쳐 결정을 내린다. ‘생각 프로세스’는 AI 모델이 주어진 문제를 스스로 이해하고 해결 방안을 제시하는 사고 과정을 생성하는 방식으로, 기존의 ‘생각의 사슬(Chain-of-Thought)’ 방식과 유사하다. 이를 통해 AI는 복잡한 추론이 필요한 문제도 체계적으로 해결할 수 있으며, 오답을 발견하고 이를 스스로 수정해가며 더 신뢰도 높은 답을 제공한다. ‘테스트 시간 스케일링’은 모델이 더 많은 계산 자원을 사용하여 깊이 있는 추론을 수행하는 방법이다. 이 방식은 모델이 다양한 전략을 시뮬레이션하여 최적의 솔루션을 도출하도록 돕는다. 예를 들어, 몬테카를로 트리 탐색(MCTS) 등의 방법을 활용하여 다양한 시나리오를 검토할 수 있다. OLAF v2는 두 가지 버전(14B, 1.5B)으로 출시되었으며, 정교한 STEM(과학, 기술, 공학, 수학) 문제 해결을 위한 추론 특화 모드를 지원한다. 또한, 32K의 context length를 지원하며, RAG(검색 기반 생성) 및 도구 기반 애플리케이션에 적합하다. 학습 과정에서 환각을 줄이고 신뢰도를 높이기 위해 부적절한 질문에 대한 거부 메커니즘을 강화하였다. OLAF v2는 최근 한국 최초 수학 추론 벤치마크인 HRM8K 서브셋인 GSM8K와 Omni-MATH에서 평가를 진행했다. GSM8K에서 91.96점을, Omni-MATH에서 36.20점을 기록하며, GPT-4o(GSM8K 91.21점, Omni-MATH 30.75점)를 능가하는 성과를 거두었다. 특히 14B 모델 사이즈에서 뛰어난 성과를 나타냈다. 정한얼 원라인에이아이 대표는 "OLAF v2의 뛰어난 추론 능력은 특히 금융 데이터 분석과 리스크 평가 분야에서 강점을 보일 것"이라며 "현재 주요 금융사들과 협력 중이며, 금융권 특화 서비스로 발전시킬 계획"이라고 밝혔다. Welaunch 서아림 기자 스타트업 뉴스 플랫폼, 위런치 © 2024 Welaunch. All Rights Reserved 보도자료/기고 : editor@welaunch.kr 광고/제휴 문의: we@welaunch.kr

Welaunch
Welaunch
다른소식