AWS가 이날 연례 클라우드컴퓨팅 콘퍼런스 ‘리인벤트’를 통해 공개한 AI 칩 트레이니움3의 연산 성능은 2.5페타플롭스(8비트 부동소수점 추론 기준)로 전작보다 두 배 향상됐다. 메모리 대역폭은 4.9테라바이트(TB)로 1.7배 커졌다. 트레이니움3 서버는 64개 칩으로 이뤄진 전작 대비 두 배 이상인 144개 칩으로 구성된다.
칩 성능과 집적도를 높인 결과 트레이니움3 서버는 이전 모델보다 연산 속도가 4.4배 빠르고 에너지 소비량이 40% 적다. 엔비디아 그래픽처리장치(GPU)보다 AI 모델 훈련 및 운영 비용이 최대 50% 낮다는 게 AWS의 설명이다. 맷 가먼 AWS 최고경영자(CEO)는 “트레이니움3는 대규모 AI 훈련과 추론 분야에서 업계 최고의 비용 효율성을 보인다”고 강조했다.
AWS는 트레이니움3를 공개한 데 이어 후속 모델 트레이니움4 개발에도 착수했다고 밝혔다. 트레이니움4 서버에는 엔비디아의 칩 상호 연결 기술인 NV링크 퓨전을 적용한다. 이는 엔비디아 제품과 비(非)엔비디아 중앙처리장치(CPU)·GPU를 연결할 수 있게 한 시스템이다.
실리콘밸리=김인엽 특파원 inside@hankyung.com
관련뉴스








