Welaunch
·
9시간 전
구글, AI 차세대 하이브리드 추론 모델 ‘Gemini 2.5 Flash’ 공개
소식발행일
관심
2
630
태그
사이트
https://developers.googleblog.com/en/start-building-with-gemini-25-flash/
신청
구독
좋아요
공유
신청
구글이 17일(현지시간) 차세대 경량 AI 모델 ‘Gemini 2.5 Flash’를 Google AI Studio와 Vertex AI 플랫폼을 통해 미리보기 형태로 공개했다. 이번 모델은 기존 ‘Gemini 2.0 Flash’의 빠른 처리 속도와 저렴한 비용 구조를 유지하면서도, 추론(Reasoning) 성능을 크게 개선한 점이 특징이다. Gemini 2.5 Flash는 ‘하이브리드 추론’ 방식을 적용해, 개발자가 모델의 ‘생각하는 정도’를 직접 조절할 수 있도록 설계됐다. 사용자는 0에서 최대 24,576 토큰까지 ‘생각 예산(Thinking Budget)’을 설정해, 작업의 복잡도와 요구 품질에 따라 성능과 비용을 균형 있게 조절할 수 있다. 예를 들어, 단순 번역이나 정보 조회 같은 작업에는 낮은 예산을, 복잡한 수학 문제 해결이나 일정표 작성 등에는 중간 이상의 예산을 할당할 수 있다. 가격 측면에서도 경쟁력을 갖췄다. 입력 100만 토큰당 0.15달러, 출력 100만 토큰당 0.60달러에서 최대 3.5달러(추론 사용 시) 수준으로 책정돼, 기존 모델 대비 비용 효율성이 개선됐다. 이는 시장 내 비슷한 AI 모델들과 비교했을 때 상당히 경쟁력 있는 가격으로 평가된다. 또한 Gemini 2.5 Flash는 텍스트뿐 아니라 이미지 입력에 대한 처리 기능도 지원한다. 세분화 마스크 생성 등 멀티모달 기능을 통해 제조, 의료, 고객 서비스 등 다양한 산업 현장에서 실시간 데이터 분석과 자동화 작업에 활용할 수 있다. 구글 측은 이번 모델이 개발자들이 AI 성능과 비용 사이에서 보다 세밀한 조정을 할 수 있도록 돕는 도구가 될 것으로 기대하고 있다. 현재 미리보기 형태로 제공되고 있으며, 정식 출시에 앞서 사용자 피드백을 반영해 기능과 안정성을 계속해서 개선할 계획이다. 이번 발표는 AI 모델이 단순한 속도나 비용 경쟁을 넘어, 사용자가 직접 성능을 조절할 수 있는 유연성을 갖추는 방향으로 진화하고 있음을 보여준다. 특히 실시간 워크플로우 자동화와 복잡한 추론 작업에 적합한 모델을 원하는 기업과 개발자들에게 유용한 선택지가 될 전망이다. Welaunch 김아현 기자 스타트업 뉴스 플랫폼, 위런치 © 2024 Welaunch. All Rights Reserved 보도자료/기고 : editor@welaunch.kr 광고/제휴 문의: we@welaunch.kr
Welaunch
다른소식
더보기