구글, 새로운 AI 가속기 'Ironwood' 공개
구글이 자사의 연례 클라우드 행사인 'Cloud Next'에서 최신 AI 가속 칩 'Ironwood'를 공개했다. Ironwood는 AI 모델 실행, 즉 추론(inference)에 최적화된 일곱 번째 세대 TPU(텐서 처리 유닛)로, 올해 말부터 구글 클라우드 고객들을 대상으로 제공될 예정이다. 출시 버전은 소규모 256개 칩 클러스터와 대규모 9,216개 칩 클러스터 두 가지로 구분된다.
뛰어난 성능과 효율성 강조
아민 바흐다트(Amin Vahdat) 구글 클라우드 부사장은 Ironwood를 "대규모 AI 추론을 위한 가장 강력하고 효율적인 TPU"라고 소개했다. Ironwood는 최대 4,614 TFLOPs(테라플롭스)의 연산 성능을 제공하며, 칩당 192GB의 전용 메모리와 초당 약 7.4테라비트의 대역폭을 갖추고 있다.
특히 구글은 데이터 이동과 칩 내 지연(latency)을 최소화하는 아키텍처를 적용해 에너지 효율을 높였다. 또한 Ironwood에는 'SparseCore'라는 특수화된 연산 코어가 추가되어, 추천 시스템이나 고급 랭킹 모델에서 사용하는 데이터 처리를 더욱 개선했다.
AI 하이퍼컴퓨터와 통합 예정
구글은 Ironwood를 'AI 하이퍼컴퓨터'에 통합할 계획이다. AI 하이퍼컴퓨터는 고성능 컴퓨팅을 위한 모듈형 클러스터 시스템으로, Ironwood를 통해 더욱 강력한 연산 능력, 향상된 메모리 용량, 더욱 빠른 네트워크 성능, 그리고 높은 신뢰성을 갖출 수 있게 된다. 바흐다트 부사장은 이번 Ironwood 출시를 "추론 시대의 대규모 확장을 위한 중대한 도약"이라고 평가했다.
의견
Ironwood는 향후 AI 모델의 추론 작업을 혁신적으로 변화시킬 가능성이 크다고 생각한다. 고성능과 에너지 효율이라는 두 가지 핵심 요소를 동시에 강화한 점이 인상적이며, 특히 AI 서비스가 클라우드 기반으로 점차 확장되는 상황에서 이러한 기술은 기업과 개발자들에게 큰 경쟁력을 제공할 것으로 보인다. Ironwood를 통한 AI 하이퍼컴퓨터의 발전도 기대된다.