사피온, 4배 강력해진 데이터센터용 AI 반도체 ‘X330’ 내놨다

[IT 인사이트] 사피온, 4배 강력해진 데이터센터용 AI 반도체 ‘X330’ 내놨다

기사입력 2023.11.16 13:00

▲류수정 사피온 대표이사가 ‘X330’을 소개하고 있다.

국산 추론용 NPU ‘X330’, L40S比 성능 2배 우수
SK하이닉스·NHN클라우드·SKT 협력 지속
내년 자율차용 IP·고성능 엣지 NPU ‘X340’ 출시

사피온이 전작 X220 대비 성능이 최대 4배가 향상된 추론용 AI 반도체 ‘X330’을 공개하고 데이터센터 시장을 본격 공략한다.

글로벌 AI 반도체 기업인 사피온(SAPEON)은 16일 열린 ‘SK 테크 서밋(SK tech summit)’에서 데이터센터용 AI 반도체 ‘X330’을 출시한다고 밝혔다.

사피온 류수정 대표는 15일 SKT타워에서 기자간담회를 열고 “X220의 장점을 극대화한 X330으로 AI 서비스 모델 개발 기업 및 데이터센터 시장 공략에 박차를 가할 전략이다”며, “산업 전분야에서 AI 반도체 활용도를 높여 고도의 AI 기술을 누구나 저렴하게 이용할 수 있게 제공함으로써, 모두가 첨단 기술 발전의 혜택을 향유할 수 있는 사회를 만드는데 공헌하고자 한다”고 말했다.

AI 반도체는 구현 목적에 따라 요구되는 특성이 나뉜다. AI 모델을 학습시키는 학습용, 학습된 AI 모델 기반으로 새로운 데이터 추론을 위한 추론용 등이다.

사피온이 이번 개발한 X330은 추론용 NPU로서, x220 대비 4배 이상의 연산 성능, 2배 이상의 전력 효율을 확보한 제품이다. 이는 TSMC의 7 나노공정을 통해 생산됐다. 사피온은 "이는 엔비디아의 L40S를 겨냥하고 나온 제품으로, 자체 성능 측정 결과 연산 성능은 약 2배, 전력 효율은 1.3배 이상 우수하다"고 말했다.

기존 사피온 X220은 국내 최초로 고성능 AI 언어 모델인 ‘BERT’ 추론에서 우수한 성능을 증명한 바 있고, X330 은 챗GPT의 원천기술 ‘트랜스포머(Transformer)’ 기반 LLM(Large Language Model) 실행을 달성했다.

사피온 마이클 쉐바노 CTO는 “사피온은 엔비디아 대비 마켓 사이즈는 작기 때문에 범용보다는 좀더 추론 영역에 특화했다”며, “장기적으로 여러 훈련에 집중할 계획은 있다”고 말했다.

X330은 X220과 달리 SK하이닉스의 GDDR6 제품이 전량 고려되고 있는 만큼 SK하이닉스와의 협력도 주목된다. 특히 사피온은 자사 칩을 생성형 AI 모델을 비용 효율적으로 경량화하는 흐름에 발맞춰 HBM, 칩렛, CXL 등 다양한 선도 기술을 도입할 계획이다. 2025년 말 X430, 이어 X530 제품 출시가 예정되고 있다. 사피온은 "향후 모델에는 5 나노공정이 적용되며, 지속적으로 메모리 대역폭에 상당한 개선은 계속 있을 것"이라고 전했다.

사피온은 이외에도 다양한 협력을 통해 AI 서비스 성과를 달성해왔다. NHN클라우드와 국내 최초 AI 반도체 기반 클라우드 인프라를 구축했고, 데이터센터뿐만 아니라 SKT와 ‘NPU 팜’ 을 통해 협업하고 있다.

이는 SKT와 SKB 가산 IDC 내에 X220 장착 서버를 사용해 구축한 팜으로, 7.6페타플롭스(Petaflops)의 처리량, 최대 7.7배의 전성비를 보인다. 류 대표는 “국내 최초로 대규모 팜을 구축해 이미지 분석, 자연어 처리, 화질 개선 등 서비스 상용화 가능성을 확인한 사례”라고 말했다. 또한 사피온은 최근 국내 대형병원과도 협약을 맺었다고 밝혔다.

■ 성능 대폭 강화 X330, “全산업 분야 적용 기대”

X330은 전작 대비 응용범위가 표준 기술 기반 하에 대폭 확대돼 다양한 산업군에 적용이 가능하다.

X330은 64K MXC와 4NVP로 구성된 4개의 AI 코어 및 16개 RISC-V 기반 CPU가 탑재된다. 8개 SK하이닉스의 16GB GDDR6가 내장되며, 각 상은 자체 GDDR 컨트롤러로 제어된다. 각 총 16GB의 메모리와 256GB/s 메모리 대역폭을 제공한다. 호스트 프로세서와 통신할 수 있는 PCIe Gen 5 인터페이스 등도 지원된다.

또한 X330은 동영상 관련 프로그램의 처리속도 향상을 위한 비디오 코덱 및 비디오 후처리 IP를 내장하고 있다. X330은 내장된 하드웨어 IP를 통해 4채널 4K 60fps 동영상 입력 처리가 가능하다. X330은 플로팅 포인트 연산을 지원하고, 확장성이 높다.

특히 사피온은 이번에 2개 칩이 탑재된 고성능 라인업으로 '프라임 카드'를 새롭게 브랜딩 했다. 이는 컴팩트 카드의 2배 이상 퍼포먼스를 충족하는 최고 수준 하드웨어 성능을 확보해 한 장으로도 다양한 연산이 가능하다. 반면 성능 대비 전력 소모는 최소화했다.

류 대표는 “프라임 카드는 512GB/s 대역폭을 확보해 다양한 크기의 모델에서 동시에 수많은 파라미터들이 메모리와 AI 코어간 이동이 가능하다”며, “해당 수준 LLM을 카드 하나로 모두 지원할 수 있으며, 멀티 카드로 더 큰 사이즈도 지원한다”고 설명했다.

사피온은 X330 반도체 HW와 함께 서버 장착시 성능을 최적화할 수 있는 ‘ONNX(개방형 신경망 교환, Open Neural Network Exchange)’ 기반의 소프트웨어 스택을 지원한다. AI 추론 플랫폼 소프트웨어 및 SDK(소프트웨어 개발 도구)도 함께 제공한다. 또한 다수의 서버와 클러스터 등 기존의 GPU 기반에서 사피온 교체시 즉각 사용을 지원하는 서비스가 제공된다.

사피온에 따르면, X330은 올해 연말부터 매출이 발생하기 시작해 내년도 X330이 본격 양산되며 의미 있는 매출이 발생할 것으로 예측된다.

류 대표는 “전 세계 AI용 데이터센터 서버 규모는 2027년도 619만대로 현재 4배 정도 증가할 것이다. 특히 추론용 시장이 확대되고 있다. 사피온은 지속적으로 고성능 프로세서 개발에 집중할 것이며, 향후 자율주행자동차용 IP(반도체 설계자산), CCTV 등 고성능 엣지 디바이스용 AI NPU 도 선보일 계획”이라고 말했다. 예컨대 ‘X340’은 300 시리즈에서 변형된 자율주행용 IP로, 내년도 출시될 예측이 나오고 있다.

한편 사피온은 X330을 SKT의 ‘글로벌 Al 컴퍼니’로 도약을 위한 ‘SKT Al 피라미드’ 전략의 AI 인프라, AIX, AI 서비스 3대 영역 중에 근간이 되는 인프라 영역에 적용해 지속적으로 신규 비즈니스 기회를 창출할 수 있는 관련 사업으로도 확장해 나갈 방침이다.

#GPU #SKT #AI반도체 #사피온 #생성AI