모듈형 AI 데이터센터 아키텍처 설계 기술로 AI 인프라 비용 절감과 효율 개선에 기여.
서로 다른 장치를 필요에 따라 자유롭게 조합해 쓸 수 있는 '모듈형 AI 데이터센터 아키텍처'를 설계하고, 다수의 장치 간 연결 방식과 링크·장치 간 위상 등을 체계적으로 정리한 설계 가이드를 제시했다.
특히 차세대 연결 표준인 컴퓨트익스프레스 링크(CXL)를 기반으로 서로 다른 시스템 장치들을 서로 다른 노드(Node)에 분리·관리하는 저전력·고효율 링크 기술을 개발했다. 이에 모듈형 AI 데이터센터 구조의 확장성과 운영 유연성을 동시에 개선했다.
아울러 UALink, NVLink 등 가속기 중심의 링크 기술과 고대역폭 메모리(HBM) 반도체 기술을 모듈형 AI 데이터센터 구조에 통합하는 방향을 제시했다. 이러한 링크 기반 시스템 및 데이터센터 구조는 기술 백서 형태로 공개했다. 이를 통해 AI 인프라 비용 절감과 시스템 효율 개선에 기여했다.



AI 시대의 속도는 상상을 뛰어넘습니다. 그만큼 더 빠르고, 더 똑똑하고, 더 효율적인 인프라가 필요합니다. 대한민국 과학기술인상 1월 수상자인 정명수 파네시아 대표(KAIST 석좌교수)는 AI 시대, 변화의 중심에서 해법을 찾았습니다. 그는 컴퓨터 아키텍처 분야에서 가장 권위있는 학회인 ISCA의 명예의 전당에 헌액되는 등 학술적으로 세계 정상에 올랐으며, 동시에 창업가로서 관련 기술의 산업화를 가속화하고 있습니다. 그래픽처리장치에 필요한 만큼만 메모리를 붙여 쓰게 하는 AI 가속기 메모리 확장 기술로 CES 혁신상을 받았고, 서로 다른 장치를 자유롭게 조합해 쓰는 ‘모듈형 AI 데이터센터’ 기술로 미래 데이터센터의 방향도 제시했습니다. 거창한 비전보다 “사람들이 정말 필요로 하는 기술을 만들고, 더 많은 이들에게 기회를 주고 싶다”는 그의 철학은 연구와 기업 활동의 중심입니다. 과학자이가 기업가로서 미래 엔지니어들에게 롤모델이 되어준 정명수 대표의 연구이야기를 소개합니다.
새해를 시작하며 이렇게 큰 상을 수상해 뜻깊습니다. 이번 수상은 개인의 성과라기보다, 그동안 함께 연구하고 고민해 온 많은 분들의 도움 덕분입니다. 연구실 구성원들과 동료 연구자, 그리고 산업계에서 협력해주신 분들께 깊이 감사드립니다. 제가 해온 연구가 이러한 분들의 노력과 신뢰 위에서 가능했다는 점을 다시 한 번 느끼는 계기이기도 합니다. 앞으로도 지금까지와 마찬가지로, 함께 성장하고 배우는 연구를 이어가고자 합니다. 특히 대한민국 과학기술의 미래를 이끌어갈 젊은 연구자와 엔지니어 분들께 조금이나마 도움이 될 수 있는 개발 및 연구 환경을 만드는 데 기여하고 싶습니다. 또한 AI 인프라와 반도체 연결 기술 연구를 통해 관련 분야 전반에 긍정적인 기여를 할 수 있기를 희망합니다.
AI 인프라 연결 기술의 한 축인 패브릭 스위치 제품에 대해 세계 최초로 실리콘 구현을 마친 이후, 지난해 하반기부터 관련 기술을 적용한 초기 실리콘이 산업계 협력 파트너들을 중심으로 공유되면서, 감사하게도 예상보다 많은 관심과 논의가 이어지고 있습니다. 새해에는 이를 계기로 산업계와의 기술 협력과 향후 상용화를 위한 논의가 보다 구체적으로 진전되기를 기대하고 있습니다.
2026년에는 그동안의 연구 결과가 실제 현장에서 어떤 방식으로 활용될 수 있을지를 현장의 목소리를 통해 배우고, 저와 같이해주시는 많은 분들의 성공을 이끌어 내기 위해 최선의 노력을 다하고자 합니다. 또한 데이터센터 연결 기술과 관련된 생태계를 차분히 확장하며, 기존 연구를 보다 실용적인 방향으로 발전시키는 데 집중하고자 합니다.
AI 및 고성능 컴퓨팅 환경에서 필요한 연결 기술을 중심으로 연구를 진행하고 있으며, 특히 여러 장치가 함께 동작하는 대규모 시스템에서 메모리와 스토리지를 보다 효율적으로 활용할 수 있는 구조에 관심을 두고 있습니다. 이 때 연산 성능 향상뿐만 아니라, 자원 접근 방식과 연결 구조가 전체 시스템 효율에 미치는 영향을 함께 고려하며 연구를 이어가고 있습니다. 이러한 연구가 학문적 성과뿐 아니라, 실제 시스템 설계에도 참고가 되기를 기대합니다.
AI가 본격적으로 주목받기 이전부터, 대규모 컴퓨팅 시스템에서는 여러 장치와 자원을 어떻게 효율적으로 연결하고 활용할 수 있는지가 중요한 과제라고 인식해 왔습니다. 이미 고성능 컴퓨팅 환경에서는 연산 자원과 메모리가 분산된 구조가 일반적이었고, 이로 인한 통신 지연과 메모리 접근 병목 문제가 반복적으로 나타났습니다. 이러한 한계를 보며, 개별 장치 성능 향상만으로는 전체 시스템 효율을 높이기 어렵다는 점에 관심을 갖게 되었고, 이 문제의식이 연결 기술과 메모리 구조 연구로 이어졌습니다. 최근 많은 양의 메모리 자원과 연산 자원을 요구하는 대규모 AI 응용의 확산과 함께 그 중요성이 더욱 분명해졌습니다.
메모리 및 스토리지 관련하여 다양한 연구를 해오면서 초점을 맞췄던 것은 1) 무한대의 메모리가 있는 것과 같은 시스템을 구축하여 다양한 계산 장치에 데이터를 공유하는 것과 2) 계산 장치로 데이터를 이동시킴에 있어서 병목이 발생하지 않도록 설계하는 것이었습니다. 세부적인 구현은 시대와 요구에 따라 여러 방식으로 변경되고 발전했지만, 이 두 가지 연구 초점은 모든 연구의 근간이 되었고, 인터페이스 설계의 관점에서 많은 결과를 가져왔습니다.
돌이켜보면 저희가 무엇인가 먼저 연구한다던가 결과를 내었다기보다는, 비가 오면 우산을 써야하듯 대량의 데이터를 이용하는 AI가 각광을 받는 상황에서 이를 서비스하기 위한 대규모 데이터센터가 더욱 활성화된다면, 컴퓨트익스프레스링크 (Compute Express Link, CXL)가 궁극적으로 채택하거나 수용해야하는 내용이 무엇일지 먼저 고민하고 개발한 것이 누구보다 먼저 연구결과와 시제품을 만드는 결과로 이어졌습니다. 데이터 공유를 위한 인터페이스 메커니즘 등을 먼저 연구하고 개발한 것이 이러한 예시입니다.
하이퍼스케일러가 최근 사용하고 있는 GPU 규모의 수는 수백만개 수준이며 각 하이퍼스케일러는 이를 수용하기 위해서 표준 축구장을 기준으로 대략 수천개 이상의 면적에 달하는 공간을 확보하고 있습니다. 이러한 대규모의 장치와 공간에 대한 구조 설계는 폭발적으로 발전하고 있는 AI 모델이 사용자들에게 서비스 형태로 원활히 제공되도록 하는 데에 핵심적인 역할을 합니다. 특히 다수의 장치들을 연결하는 방식, 링크 및 장치 간 위상 설계는 이러한 대규모의 GPU 및 가속장치들이 병렬성을 확보하고, AI 모델이 높은 정확도와 성능을 달성하는 데에 결정적인 역할을 하기에, 다양한 시각에서의 분석을 통해 올바른 방법을 도출해야합니다. 이를 위해 해당 설계 가이드를 작성했습니다.
구체적으로, 해당 설계 가이드는 AI의 구조와 모델을 알아보고 이들이 데이터센터에 어떤 방식으로 적용되는지를 소개합니다. 그리고 전체 시스템 상에서 현재 채택되고 있는 NVIDIA GPU 기반 설계 방식의 한계 그리고 미래 데이터센터가 갖추어야하는 모듈형, 조립식 AI 아키텍처와 링크 반도체를 소개하고 이들이 가져오는 이득 등을 다양한 방식으로 분석하여 보여주고 있습니다.
그래픽처리장치 메모리 확장키트’ 혹은 ‘CXL-GPU’라는 이름으로 소개된 기술로 혁신상을 수상하였습니다. AI 가속장치 혹은 GPU의 메모리가 부족할 때, 추가적으로 값비싼 GPU를 구매하여 메모리 부족 문제를 해결하는 것이 아니라, 메모리가 고도로 집적된 장치를 필요한 만큼 GPU에 직접 연결하여 해결하는 기술입니다. 해당 기술을 적용할 경우, 사용자들은 대규모 AI 응용을 구동하기 위한 시스템을 구축하는 데에 있어 불필요한 GPU 구매를 최소화함으로써 구축 비용을 최적화할 수 있습니다. 해당 기술은 실제 저지연 컨트롤러나 설계자산이 없으면 접근할 수 없는 설루션이기에, 전 세계에서 유일한 저희의 패브릭 컨트롤러가 가장 큰 차별점이자 혁신 포인트라고 볼 수 있습니다.
2026년 1월 라스베거스에서 열리는 CES에는 최근 샘플칩이 나온 PCIe 6.4/CXL 3.2 기반 패브릭 스위치를 적용한 노드를 출품합니다. 해당 칩은 자유로운 위상 구성과 모듈형 장치 등을 조립식으로 구성해주고, 이들 간에 데이터 공유를 제공하는 전 세계 최초이자 유일한 CXL 3.2 패브릭 스위치입니다. 저희 팀에서 만든 설계자산 기술로만 순수하게 구현한 칩이라는 점 또한 일반적인 장치들과 차별화되는 포인트입니다.
이번 전시는 수천 개 이상 장치가 여러 서버 랙에 분산되어 협력해야 하는 대규모 AI·HPC 응용 환경에서 연결 기술이 어떤 방식으로 시스템 구성에 기여할 수 있는지를 사례 중심으로 소개하는 자리가 되기를 기대하고 있습니다.
AI 응용은 메모리, 연산 능력, 네트워크 지연 등에서 서로 다른 요구를 갖고 있어 CPU, GPU, 메모리가 하나의 기기로 구성되어야하는 기존의 구조로는 대규모 서비스를 대응하기 어렵습니다. 이러한 점에서 필요한 자원을 필요에 따라 조합할 수 있는 ‘모듈형 AI 데이터센터’ 또는 ‘컴포저블 아키텍처’가 하나의 방향이 될 수 있다고 생각합니다. 참고로 기존 엔비디아(NVIDIA)의 서버 구조와 같은 형태는 장치 비율이 고정되어 있어 응용 특성에 맞춘 자원 활용에 한계가 있었습니다. 연결 기술을 통해 이러한 제약을 완화하고, 자원 활용 효율을 높이는 방향을 연구하고 있습니다.
이상적인 차세대 AI 데이터센터의 모습은 모든 장치간 연결과 커뮤니케이션, 그리고 전체 병렬성 관리와 운영이 의사교환이나 데이터의 교환 오버헤드도 없이 하나의 시스템처럼 동작할 수 있도록 하는 것이라고 생각합니다.
연구실에서 축적한 기술을 실제 산업 환경으로 확장하는 데에는 한계가 있다는 점을 느끼게 되었습니다. 제품 개발, 특히 고성능 반도체 제품 개발에는 연구실 차원을 넘어선 공정과 자원이 필요하기 때문입니다. 이에 기술의 산업적 가능성을 보다 현실적으로 검증하고, 관련 생태계에 기여하고 싶었습니다. 무엇보다 이러한 목표와 생각에 동의해주시고, 부족하지만 저와 뜻을 같이해주는 분들의 성공을 이끌어내고 이러한 성공을 다시 많은 분들에게 공유하고 싶어서 창업을 하였습니다.
앞으로도 링크 기술과 설루션 개발을 통해 다양한 자원을 보다 효율적으로 활용할 수 있도록 AI 인프라 구조를 개선하고, 젊은 구성원들과 함께 성장뿐만 아니라 의미있는 성공을 이끌어내는, 그리고 그 공유를 통해 다방면 도움이 될 수 있는 조직을 만들어가고자 합니다.
제가 정말 많은 부분에서 부족함에도 불구하고 선뜻 같이해주시는 분들, 그리고 하나의 목표를 위해 같이 하는 분들을 보고 있으면 진심으로 그분들의 성공이 무엇인지 다양한 형태로 확인하고 그분들의 성공을 실현하는 일에 진심일 수밖에 없습니다. 여러 가지로 어려움이 있지만 다양한 영역에서 제가 활동하고 열정을 유지할 수 있는 것은 저의 생각과 방향에 동의해주시고 저의 부족함을 알고도 함께해주시는 분들 덕분이라고 생각합니다.
AI 반도체 분야는 기술적 난이도와 함께 협업의 중요성이 매우 큰 분야입니다. 개인의 역량도 중요하지만, 함께 일하는 사람들과의 신뢰와 소통이 각자가 원하는 결과의 성취에 큰 영향을 미칩니다. 따라서 기술뿐만 아니라, 어떻게 협력하고 의견을 조율할 것인지에 대해서도 지속적으로 고민해보시길 권하고 싶습니다. 장기적인 관점에서 보면, 사람과의 관계가 연구와 창업 모두에서 중요한 자산이 됩니다.
대규모 AI 응용 환경에서는 각 장치의 개별 성능뿐 아니라 이들을 얼마나 효율적으로 연결하고 활용할 수 있는지가 점점 더 중요한 요소가 되고 있습니다. 이러한 측면에서 링크 반도체와 링크 솔루션은 상대적으로 주목받지 않았지만 중요한 분야라고 생각합니다. 현재 다양한 링크가 시장에서 제시되고 있고 대규모 AI기술을 보유하고 있는 각 기관과 데이터센터, 반도체 벤더들은 효율적이면서도 고속인 링크 솔루션을 확보하는데 최선을 다하고 있습니다. 저희는 이제 시작하는 시점이라 이 부분에 대해서 이해가 조금 부족할 수 있으나 분명 올바른 링크 기술 연구 및 개발은 대규모 시스템에서 주도권을 확보하는 핵심이 될 것입니다. 뿐만 아니라 장기적인 관점에서 해당 분야에 대한 지속적인 연구가 이어진다면 국가 경쟁력 확보에도 도움이 될 수 있을 것입니다. 중·단기 성과도 중요하지만 그 만큼 꾸준한 기술 축적이 필요하다고 생각됩니다.
많은 학생분들이 이른 시기부터 경쟁 환경에 놓이며 스스로를 남들과 비교하는 모습을 자주 보게 됩니다. 하지만 장기적으로는 어제의 자신보다 얼마나 성장했는지를 돌아보는 기준이 더 건강한 동기가 될 수 있다고 생각합니다. 무엇보다 ‘얼마나 남을 도울 수 있는 사람이 될 수 있는가’가 결국 본인의 성장과 성공에 핵심임을 알면 좋을 것 같습니다. 더불어, 결과보다는 과정에서 최선을 다했는지를 스스로에게 묻는 태도 또한 중요합니다. 각자의 속도로 꾸준히 나아가다 보면, 자신에게 맞는 길을 발견하는 데 도움이 될 것이라 믿습니다.