AI 서비스에서 기업간 경쟁이 치열해지며, 최근에는 AI 모델의 크기를 늘리거나 더 많은 데이터를 활용함으로써 높은 정확도를 달성하고자 하는 시도가 반복되고 있다. 이로 인해 기업들의 메모리 수요가 늘고 있으며, 메모리 용량을 늘리기 위해 서버를 추가하다보면 기업들의 지출 부담도 동시에 증가하고 있는 추세이다.
▲파네시아 2024 OCP Global Summit 참가
CXL 기반 AI 가속 서버 구성 비용 절감
AI 서비스에서 기업간 경쟁이 치열해지며, 최근에는 AI 모델의 크기를 늘리거나 더 많은 데이터를 활용함으로써 높은 정확도를 달성하고자 하는 시도가 반복되고 있다. 이로 인해 기업들의 메모리 수요가 늘고 있으며, 메모리 용량을 늘리기 위해 서버를 추가하다보면 기업들의 지출 부담도 동시에 증가하고 있는 추세이다.
파네시아가 2024 OCP Global Summit에서 세계 최초로 CXL 3.1 스위치를 활용한 CXL 탑재AI 클러스터를 공개한다고 27일 밝혔다.
파네시아가 올해 참여하는 OCP Global Summit은 세계 최대 규모의 데이터센터 하드웨어 개발 협의체인 OCP가 주최하는 행사로, 관련된 글로벌 기업들이 대거 참가하여 비용 효율적이며 자원 관리가 용이한 데이터센터 IT 인프라 구축에 관해 논의한다.
특히 AI 관련 주제가 중점적으로 다루어지는 올해 행사에서, 파네시아는 CXL 탑재 AI 클러스터를 활용해 챗GPT 등 서비스에서 활용되고 있는 차세대 AI 응용인 RAG를 가속하는 데모를 공개해 글로벌 고객사 확장에 나선다.
CXL은 데이터센터 등의 시스템에서 사용자의 수요에 맞는 유연한 메모리 확장을 가능케 한다. 예컨대 사용자가 메모리 확장을 계획한다면, 오직 메모리 확장을 위한 CXL 장치만을 구매할 수 있어 비용을 절약할 수 있다. 이러한 이유로 CXL을 통한 메모리 확장은 빅테크 기업들에게 많은 관심을 받고 있다.
이번 2024 OCP 글로벌 서밋 전시회에서 파네시아는 그간 개발해온 AI향 CXL 기술의 집약체인 CXL 탑재 AI 클러스터를 출품할 예정이다. 파네시아의 CXL 탑재 AI 클러스터는 CXL-메모리 노드와CXL-GPU 노드가 연결된 형태이다.
이 중 CXL 메모리 노드에는 CXL 메모리 확장장치가 다수 장착돼 대용량 메모리를 제공하며, ‘CXL-GPU 노드‘에는 CXL-GPU 장치가 집약적으로 장착되며 AI 연산을 가속한다.
파네시아 관계자는 “이러한 CXL 3.1 스위치가 포함된 AI 클러스터는 세계 최초로 공개되는 것이며, AI 가속 솔루션인 CXL-GPU가 포함된 온전한 시스템 또한 파네시아가 세계 최초로 개발한 것이다”고 강조했다. 또한, “해당 CXL 3.1 스위치 칩은 파네시아의 핵심 제품으로 내년 하반기 고객사들에게 공급될 예정“이라고 밝혔다.
파네시아 관계자는 “자사의 CXL 3.1 스위치와 고성능 CXL IP를 활용하면 수십, 수백대의 장치들을 연결할 수 있어 RAG와 같은 최신 AI 응용들을 데이터센터 수준에서 효과적으로 가속할 수 있다”고 설명하며, “이번OCP Global Summit 출품을 통해 기존 협업을 진행하던 글로벌 기업들과의 관계를 확고히 다지고, 새로운 고객사를 확보하고자 한다”며 포부를 밝혔다.
한편, 파네시아는 AI를 가속하기 위한 CXL 솔루션들을 다수 발표했으며, 2023년 FMS(플래시메모리서밋) 전시회에서는 상업적으로 가장 많이 활용되고 있는 AI 응용 중 하나인 추천시스템을 CXL 3.0/3.1 기능으로 가속하는 데모를 선보였다.
올해 CES 2024 전시회에서는 메모리 근처에서 연산을 수행해 데이터 이동 오버헤드를 줄일 수 있는 CXL 탑재 AI 가속기를 발표해 CES 혁신상을 수상한 바 있다.