MWC26 현장서 업무협약…GPU 증설 대신 자원 연결 구조 바꿔 효율 개선 추진
SK텔레콤이 컴퓨팅 자원 연결 방식 자체를 바꾸는 방식으로 AI 데이터센터(DC) 효율 개선에 나선다. GPU를 늘리는 확장 방식만으로는 메모리 수요 증가와 자원 활용 불균형 문제를 해소하기 어렵다는 판단에서다.
SK텔레콤은 3월 4일(현지시간) 스페인 바르셀로나에서 열리는 MWC26 현장에서 파네시아(Panmnesia)와 ‘CXL 기반 차세대 AI DC 구조(아키텍처)’ 공동 개발을 위한 업무협약(MOU)을 체결했다고 밝혔다.
양사는 CPU·GPU·메모리가 서버 단위로 고정된 기존 구조에서 발생하는 비효율을 줄이기 위해, CXL(Compute eXpress Link) 기반으로 자원을 유연하게 연결·조합하는 방향의 구조 전환을 추진한다. 한 서버에서 남는 자원이 생겨도 다른 서버가 이를 활용하기 어려운 한계를 완화하고, 특히 메모리 수요가 늘어날 때 GPU까지 함께 증설해야 하는 상황을 줄이겠다는 구상이다.
자원 연결 범위도 서버 내부에 제한하지 않고, 서버 여러 대를 묶는 랙(Rack) 단위까지 확장해 필요한 자원을 선택적으로 활용하는 방식을 검토한다. CXL을 활용해 CPU·GPU·메모리를 더 촘촘하게 연결해 쓰는 구조를 목표로 한다는 설명이다.
연결 경로 자체를 바꾸는 시도도 포함됐다. 기존에는 GPU 협업 연산 과정에서 이더넷 등 범용 네트워크를 통해 데이터를 주고받는 방식이 일반적이었으나, 이 과정에서 데이터 복사와 소프트웨어 개입이 발생해 지연이 생길 수 있다는 점을 고려해 CXL 기반 연결을 적용하는 방안을 추진한다.
역할 분담도 제시됐다. SK텔레콤은 대규모 AI DC 구축·운영 역량과 AI 모델 개발·상용화 경험을 바탕으로 상용 환경에 최적화된 구조 설계를 주도하고, 파네시아는 패브릭 링크 스위치와 링크 컨트롤러 등 CXL 관련 링크 반도체 기술을 기반으로 연결 구조 확장에 필요한 기술 요소를 제공한다.
양사는 실제 AI 모델을 구동하며 GPU·메모리 활용률, 지연시간, 처리량 등을 종합 검증한 뒤 2026년 연말까지 차세대 AI DC 구조 성과물을 공개하고, 이후 대형 AI DC 환경 실증을 거쳐 상용화·사업화를 추진할 계획이다.