위런치 로고
KT, 한국어 특화 LLM ‘믿:음 2.0’ 오픈소스 공개… 국내 최초 110억 파라미터 상업용 허용

Welaunch
Welaunch
·
7시간 전

KT, 한국어 특화 LLM ‘믿:음 2.0’ 오픈소스 공개… 국내 최초 110억 파라미터 상업용 허용

소식발행일
 
관심
3
78
태그
사이트
https://enterprise.kt.com/main.jsp
구독
좋아요
공유
신청
KT(대표이사 김영섭)가 자체 개발한 한국어 특화 초거대언어모델(LLM) ‘믿:음 2.0’을 오픈소스로 공개한다고 3일 밝혔다. 이번 공개는 글로벌 AI 개발자 플랫폼 허깅페이스(HuggingFace)를 통해 이뤄지며, 기업·공공·개인 누구나 상업적으로 제약 없이 활용할 수 있도록 개방된다. ‘믿:음 2.0’은 KT가 추진하는 ‘한국적 AI’ 철학을 구현한 모델로, 한국의 언어·문화·사회적 맥락을 반영한 독자적 AI다. KT는 모든 학습 데이터를 사전 저작권 확보를 통해 책임감 있게 수집·가공했으며, 한국어 구조에 최적화된 토크나이저도 자체 개발했다. 이번에 공개되는 모델은 ▲115억 파라미터 규모의 ‘믿:음 2.0 Base’ ▲23억 파라미터 규모의 ‘믿:음 2.0 Mini’ 두 가지다. 두 모델 모두 한국어와 영어를 지원하며, 특히 Base 모델은 한국어 질의응답과 문서 기반 지식 응답에서 뛰어난 성능을 발휘한다. KT는 국내 최초로 110억 파라미터 이상 LLM을 상업용 오픈소스로 제공하는 기업으로 기록됐다. 믿:음 2.0은 성능 지표에서도 우수성을 입증했다. KT와 고려대학교가 공동 개발한 한국어 특화 AI 성능 평가 지표 ‘Ko-Sovereign(코-소버린)’에서 글로벌 오픈소스 모델을 상회하는 결과를 기록했으며, KMMLU, HAERAE 등 주요 벤치마크에서도 경쟁 모델 대비 높은 이해도와 생성력을 보였다. 모델 학습에는 국내 문학작품, 교육자료, 법률·특허 문서, 사전 등 다양한 고품질 한국어 데이터가 활용됐다. 저작권이 불분명한 데이터는 모두 배제했으며, 데이터 필터링 이후는 합성 기법을 통해 학습량을 보완했다. 또한 고려대 민족문화연구원과의 협력을 통해 학술적 신뢰성도 확보했다. KT는 AI 기술의 신뢰성과 투명성을 강화하기 위해 국내외 가이드라인을 바탕으로 ‘AI 영향 평가 체계’를 적용했고, 국산 AI 반도체 스타트업 리벨리온과 협력해 국산 AI 칩 최적화도 함께 진행했다. 프렌들리AI와의 제휴를 통해 사용자들이 허깅페이스에서 별도 설치 없이 무료로 체험할 수 있는 환경도 제공할 예정이다. KT Gen AI Lab장 신동훈 상무는 “믿:음 2.0은 한국어와 한국 문화를 깊이 이해하는 고성능 모델로, 국내 AI 사용자들에게 새로운 선택지를 제공할 수 있을 것”이라며, “KT는 한국적 사고방식을 담은 AI 모델을 통해 글로벌 경쟁력 확보는 물론, 대한민국 AI 생태계 활성화에 기여하겠다”고 밝혔다. KT는 향후 마이크로소프트와 협업해 GPT-4에 한국적 사고를 추가 학습시키는 방식의 공동 모델도 순차적으로 공개할 예정이며, 공공·민간 전반에 걸쳐 ‘한국형 AI’ 확산을 선도한다는 전략이다. Welaunch 강한나 기자 스타트업 뉴스 플랫폼, 위런치 © 2024 Welaunch. All Rights Reserved 보도자료/기고 : editor@welaunch.kr 광고/제휴 문의: we@welaunch.kr

Welaunch
Welaunch
다른소식