광섬유 기술은 장거리 데이터 전송을 빛으로 빠르게 처리해 현재 전 세계 상업 및 통신 트래픽 대부분 사용되고 있다. 그러나 데이터센터의 경우, 외부 통신 네트워크에는 광섬유를 사용하는데 반해, 내부 통신 네트워크의 대부분에는 여전히 구리선을 사용하고 있다. 구리선은 데이터 전송 속도와 대역폭에서 한계를 보인다.

AI 모델 학습과 같은 대규모 데이터 처리 작업에서 구리선은 높은 전력 소모와 데이터 병목 현상을 유발할 수 있다. 이는 GPU 가속기의 유휴 시간을 늘려 효율성을 저하시킨다. 또한, 구리선은 거리와 신호 간섭 문제로 인해 데이터 전송 효율이 떨어지며, 대규모 데이터센터 환경에서 에너지 소모를 증가시키는 요인이 된다. 이러한 단점은 데이터센터 내부 통신에 광섬유와 같은 고속, 저전력 대안의 필요성을 부각시킨다.

또한 생성AI가 점점 더 많은 에너지와 처리 능력을 요구함에 따라 데이터센터는 진화해야 한다. 

IBM이 10일 데이터센터에서 기존의 전선 기반 단거리 통신을 보완해 데이터센터 내부 연결 속도를 빛의 속도로 대폭 향상시킬 수 있는 공동 패키지형 광학(co-packaged optics : 이하 CPO) 기술을 발표했다.

데이터센터 속도 높이는 차세대 IBM 공동 패키지형 광학 모듈
데이터센터 속도 높이는 차세대 IBM 공동 패키지형 광학 모듈

이 기술은 생성AI 모델의 학습 및 실행 방식을 획기적으로 개선하는 새로운 광학 공정기술이다. IBM은 이 기술을 구동할 수 있는 폴리머 광학 도파관(Polymer Optical Waveguide, PWG)을 성공적으로 설계, 조립해 최초로 공개했다. IBM 연구진은 CPO기술이 칩, 회로 기판, 서버 간 고대역폭 데이터를 전송하는 컴퓨팅 방식에 가져올 변화를 시연했다.

이번 연구의 주요 성과는 우선 중급 전기 배선(interconnect) 대비 전력 소비를 5배 이상 줄여 생성AI 확장 비용을 낮추고, 데이터센터 간 케이블 연결 길이를 기존 1미터에서 수백 미터로 확장할 수 있다. AI 모델 학습 시, 모델 당 미국 가정 약 5000가구의 연간 전력 소비량에 해당하는 에너지를 절감해  데이터센터 에너지 효율을 극대화할 수 있다.

CPO 기술을 통해 기존 전기 배선(wiring)을 사용할 때보다 거대 언어 모델(LLM)의 학습 속도를 최대 5배까지 높일 수 있다. 이를 통해 일반적인 LLM 학습 시간이 3개월에서 3주로 단축될 수 있으며, 더 큰 모델과 더 많은 GPU를 활용할 경우 성능 향상 폭이 더욱 커진다.

CPO 기술은 모듈 외 통신을 전기에서 광학 연결로 대체할 수 있어  지속적으로 증가하는 AI의 성능 요구 충족의 새로운 대안이 될 수 있다. 이 기술은 최초의 2nm 노드 칩 기술, 7nm 및 5nm 공정 기술의 최초 구현, 나노시트 트랜지스터, 수직 트랜지스터(VTFET), 단일 셀 DRAM, 화학적 증폭 포토레지스트 등 IBM의 선도적 반도체 혁신 역사를 이어가고 있다.

IBM 리서치 연구 개발 총책임자 다리오 길(Dario Gil) 수석 부회장은 “공동 패키지형 광학(CPO) 기술을 통해 미래의 칩은 광섬유 케이블이 데이터 센터 안팎으로 데이터를 전달하는 방식으로 통신하게 될 것이며, 미래의 AI 워크로드를 처리할 수 있는 더 빠르고 지속 가능한 새로운 통신 시대를 열 것”이라고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지