위런치 로고
AWS, 에너지 효율 40% 향상 차세대 맞춤형 AI 칩 출시...엔비디아 독점 구조 깨나?

Welaunch
Welaunch
·
1일 전

AWS, 에너지 효율 40% 향상 차세대 맞춤형 AI 칩 출시...엔비디아 독점 구조 깨나?

소식발행일
 
관심
8
467
태그
사이트
https://aws.amazon.com/ko/?nc2=h_lg
구독
좋아요
공유
신청
아마존 웹 서비스(AWS)가 3일(현지시간) 미국 라스베이거스에서 열린 연례 컨퍼런스 'AWS re:Invent 2025'에서 차세대 맞춤형 AI 칩 'Trainium3'를 공식 출시했다. 이는 AWS의 네 번째 세대 AI 칩으로, 3나노미터(nm) 공정 기반으로 대규모 AI 모델 훈련과 추론을 위한 고성능·저비용 솔루션으로 설계됐다. Nvidia GPU 의존도를 줄이고 AI 개발 비용을 절감하려는 AWS의 '인하우스 실리콘' 전략이 본격화된 상징적 행보다. AWS CEO 매트 가먼(Matt Garman)은 키노트에서 "Trainium3는 이전 세대 대비 4배 성능 향상과 40% 에너지 효율성을 제공하며, 이미 100만 개 이상의 칩이 배포된 Trainium 제품군의 멀티빌리언 달러 규모 비즈니스를 더욱 가속화할 것"이라고 강조했다. 이 칩은 AWS의 자체 네트워킹 기술과 결합해 'Trainium3 UltraServer' 시스템을 구성, 최대 144개 칩을 하나의 통합 클러스터로 연결해 초대형 AI 모델 훈련 시간을 월 단위에서 주 단위로 단축한다. ▪️Trainium3의 주요 스펙과 혁신 Trainium3는 FP8 연산에서 칩당 2.52 페타플롭스(PFLOPs)의 컴퓨트 성능을 제공하며, 메모리 용량은 144GB HBM3e(이전 세대 대비 1.5배 증가), 대역폭은 4.9TB/s(1.7배 증가)로 업그레이드됐다. 특히 MXFP8과 MXFP4 같은 고급 데이터 타입을 지원해 실시간 멀티모달·추론 작업에 최적화됐으며, 에너지 효율 향상으로 데이터센터 운영 비용을 절감한다. AWS는 이를 통해 고객이 GPU 기반 인스턴스 대비 30~40% 더 나은 가격 성능을 달성할 수 있다고 밝혔다. 이 칩은 'EC2 Trn3 UltraServer' 인스턴스로 제공되며, 'EC2 UltraClusters 3.0'으로 확장 시 수만 개 칩을 연결해 100만 개 Trainium 칩 규모의 클러스터를 구축할 수 있다. NeuronSwitch-v1 인터커넥트 기술로 칩 간 대역폭을 2배 확대해 분산 훈련 효율성을 높였다. AWS Neuron SDK와 PyTorch 네이티브 통합으로 개발자는 코드 변경 없이 모델을 배포·최적화할 수 있다. ▪️Nvidia 대응 전략과 로드맵 AWS는 Trainium3 출시와 함께 Nvidia와의 호환성을 강조하며 차별화를 꾀했다. 개발 중인 차세대 'Trainium4'는 Nvidia의 NVLink Fusion 네트워킹 기술과 직접 연동 가능해, 고객이 Nvidia GPU와 혼용할 수 있도록 설계됐다. 이는 AWS가 Nvidia 독점 구조를 깨고 다각화된 AI 하드웨어 생태계를 구축하려는 움직임으로 해석된다. AWS 컴퓨트·머신러닝 부사장 데이브 브라운(Dave Brown)은 "칩 다양성은 AI 시장에 긍정적"이라며, OpenAI 등 고객이 비용·성능 이점에 따라 Trainium으로 전환할 가능성을 시사했다. ▪️고객 사례와 시장 영향 이미 Anthropic, Ricoh, Splash Music 등 고객이 Trainium을 통해 훈련 비용을 최대 50% 절감했다. Leonardo.ai는 Trainium3로 실시간 생성 비디오 프레임 생성 속도를 4배, 비용을 50% 줄였다. AWS는 Trainium3를 Amazon Bedrock 서비스에 통합해 생산 워크로드를 지원하며, 에이전트 기반 AI·비디오 생성 등 차세대 애플리케이션에 초점을 맞췄다. 이번 출시는 AWS의 글로벌 인프라 확장과 맞물려 AI 시장 재편을 가속화할 전망이다. AWS는 3.8GW 규모 데이터센터 증설을 발표하며, AI 컴퓨트 수요 폭증에 대응한다. 업계 분석가들은 "Nvidia의 지배력에 도전하는 AWS의 실리콘 전략이 성공하면 클라우드 AI 비용 구조가 근본적으로 바뀔 수 있다"고 평가했다. Trainium3는 즉시 예약 가능하며, 상세 스펙과 SDK는 AWS 공식 사이트에서 확인할 수 있다. AWS re:Invent 2025는 5일까지 이어지며, 추가 AI 혁신 발표가 예고됐다. Welaunch 김아현 기자 스타트업 뉴스 플랫폼, 위런치 © 2024 Welaunch. All Rights Reserved 보도자료/기고 : editor@welaunch.kr 광고/제휴 문의: we@welaunch.kr

Welaunch
Welaunch
다른소식