Welaunch
·
2일 전
카카오, ‘스스로 생각하고 답변하는’ 하이브리드 멀티모달 AI 모델 공개
소식발행일
관심
3
472
태그
사이트
https://www.kakaocorp.com/page/
신청
구독
좋아요
공유
신청
카카오(대표이사 정신아)가 가벼운 일상 대화부터 논리적 추론이 필요한 복잡한 문제 해결까지 하나의 모델로 처리하는 자체 개발 하이브리드 멀티모달 언어모델 ‘Kanana-v-4b-hybrid’의 우수한 성능을 5일 공개했다. Kanana-v-4b-hybrid는 지난해 7월 오픈소스로 공개한 ‘Kanana-1.5-v-3b’를 기반으로 개발됐다. 단순 이미지 설명을 넘어 정보를 종합·계산하고 스스로 검산하는 자기 점검 과정을 거쳐 환각 현상을 최소화한 것이 핵심이다. 복잡한 표·영수증·수학 문제 등에서 발생하기 쉬운 계산 실수나 조건 누락을 획기적으로 줄여 정확도를 크게 높였다. 카카오는 모델 고도화를 위해 ▲기초 학습 ▲장문 사고 사슬(Long CoT) ▲오프라인 강화학습 ▲온라인 강화학습 등 4단계 정교한 학습 절차를 적용했다. 특히 한국어 질문을 영어로 번역·재번역하는 글로벌 모델의 한계를 극복하고, 한국어 그대로 이해·사고하도록 훈련해 논리 전개 능력을 강화했다. 이 결과 한국 교육 체계 기반 벤치마크 ‘KoNET(Korea National Educational Test)’에서 92.8점을 기록하며 수능 사회탐구·수학 등 문제에서 미묘한 조건을 놓치지 않는 높은 정답률을 보였다. 유사 규모 글로벌 모델(Qwen3-VL-4B, InternVL3.5-4B, GPT-5-nano) 및 국내 모델과 비교에서도 과학·공학·일반 시각 질의응답·문서 이해 영역에서 우수한 성능을 나타냈다. 특히 수학·과학 등 복잡한 추론과 일반 시각 이해에서는 글로벌 모델을 넘어섰다. 카카오는 향후 사용자가 모드를 직접 선택할 필요 없이 AI가 질문 복잡도를 스스로 판단해 일반·추론 모드를 자동 전환하는 형태로 고도화할 계획이다. 하나의 대화창에서 자연스럽고 끊김 없는 경험을 제공하면서 비용 효율성을 극대화한다는 목표다. 김병학 카카오 카나나 성과리더는 “Kanana-v-4b-hybrid는 한국어 환경에서 가장 자연스럽고 정확하게 생각하고 답변할 수 있는 모델”이라며 “일상과 복잡한 작업을 하나의 AI로 처리하는 혁신 성과로, 한국어 특화 고성능·고효율 모델 개발을 통해 글로벌 경쟁력을 높이고 국내 AI 생태계 발전을 선도하겠다”고 밝혔다. 카카오는 지난달 멀티모달 모델 ‘Kanana-o’와 임베딩 모델 ‘Kanana-v-embedding’ 성과를 공개하고, 에이전틱 AI 최적화 모델 ‘Kanana-2’를 오픈소스로 선보이는 등 자체 AI 기술 경쟁력을 꾸준히 증명하고 있다. 한국어 기반 멀티모달 AI의 새로운 기준을 제시한 카카오의 행보가 국내 AI 연구 생태계에 어떤 파장을 일으킬지 관심이 모아지고 있다. Welaunch 이나은 기자 스타트업 뉴스 플랫폼, 위런치 © 2024 Welaunch. All Rights Reserved 보도자료/기고 : editor@welaunch.kr 광고/제휴 문의: we@welaunch.kr
Welaunch
다른소식
더보기