인공지능(AI) 모형을 경량화하고, 경량화된 모형을 효율적으로 연산하는 반도체 가속기를 개발해 다양한 환경에서 저전력으로 활용 가능한 인공지능 기반기술을 제시
ㅇ 가변 정밀도를 가지는 AI 모델 경량화를 위한 전용 반도체 칩 개발
가변적인 비트 정밀도를 가지는 인공지능(AI) 모델 경량화 기술은 메모리 요구량을 줄이고 연산 속도를 향상시키는 동시에 단일 비트 정밀도 기반의 양자화 모델보다 정확도를 높일 수 있는 장점이 있다. 그러나 이를 효과적으로 지원하는 하드웨어의 부재로 인해 실제 적용에 어려움을 겪고 있다. 본 연구에서는 기존 가변 정밀도 지원 기술이 안고 있던 면적 및 에너지 측면에서의 비효율성을 개선하기 위해 새로운 비트 단위 연산 방법 및 가변 부분 결과 조합 방식을 도입하여 기존의 한계를 극복한 최적화 방법론을 제시하였다. 이를 바탕으로 아키텍쳐와 칩을 구현하고, 그 성능 향상을 실험을 통해 입증하였다. 본 기술은 향후 스마트폰 등 전력소모가 매우 중요한 모바일 환경 등에서도 AI 연산을 가능하게 하는 핵심 원천 기술로 활용될 수 있을 것으로 기대된다.
ㅇ 대규모 언어 모델 경량화 연산을 위한 전용 AI 반도체 가속기 설계
대규모 언어 모델을 경량화할 때, 정수형 변수와 부동소수점 형식의 변수를 함께 사용하는 경우가 많다. 그러나 기존 AI 반도체 가속기에는 이러한 혼합 연산을 지원하는 연산기가 없어 사용자들은 상대적으로 면적이 넓고 전력 소모가 큰 부동소수점 연산기를 사용할 수 밖에 없었다. 이러한 문제점을 극복하기 위해 본 연구진은 네이버와의 산학협력 연구를 통해 부동소수점 연산기 보다 면적과 전력 소모가 작은 것으로 잘 알려진 정수형 연산기를 사용하여 부동 소수점 연산을 처리하는 새로운 방법을 제시하였다. 또한, 해당 방식으로 수행한 연산 결과가 기존 부동 소수점 연산 결과와 동등한 수치 오류 레벨을 생성함을 최초로 증명하였다. 해당 기술은 대규모 언어 모델 추론 서비스의 전력효율 및 성능을 크게 향상시킬 수 있을 것으로 기대된다.


첨단 과학기술의 결정체로 여겨졌던 인공지능이 조용히, 하지만 깊게 우리의 일상 속에 스며들고 있습니다. 하지만 인공지능 기술의 확산과 함께 급증하는 전력 소모는 AI 산업의 지속 가능성에 경고음을 울리고 있습니다. 5월의 수상자인 김재준 교수는 인공지능 모델의 경량화 연구를 진행하고, 이에 최적화된 전용 반도체 칩을 설계하여 인공지능의 지속가능한 발전 가능성을 한층 끌어올렸습니다. 다가오는 5월 17일 '세계 전기통신 및 정보사회의 날'을 앞두고, 인공지능의 미래를 설계하는 연구자 김재준 교수를 만나 연구의 의미를 되짚어보았습니다.
이달의 과학기술인상을 받게 되어 매우 기쁘고 감사한 마음입니다. 연구 과정에서 어려움이 생길 때마다 함께 고생하며 극복해준 연구실 학생들과 졸업생들, 그리고 항상 아낌없는 도움을 주신 동료 연구자 여러분 덕분에 과분한 상을 받았습니다. 이 자리를 빌려 감사의 인사를 전합니다.
인공지능과 가속기 반도체 관련한 연구 결과들이 하루가 멀다 하고 쏟아져 나오고 있는 상황인데 시간적 제약 때문에 막상 하루하루 해야만 하는 일들에 시간을 더 쓰다 보니 조급함이 생기던 차에 감사하게도 연구년을 맞아 관련 흐름을 조금 더 차분하게 관찰하고 미래에 대해 생각하는 기회로 삼으려고 하고 있습니다. 지난달에는 프랑스에서 열린 학회에 학생들과 함께 참석해 연구 결과를 발표하고 해외 연구자들과 의견을 나눌 기회를 가졌습니다. 다음 달에는 미국에서 열리는 인공지능 시스템 학회에 참석해 관련 연구자들과 공동연구 기회를 모색해볼 계획입니다. 연구년 동안 특히 인공지능 컴퓨팅에 최적화된 차세대 반도체 메모리 구조에 대해 산업계 분들과도 의견을 나누면서 생각을 가다듬어보려 합니다.
저의 오랜 연구주제인 저전력 집적 회로 설계는 기존 회로와 동일한 성능과 동작을 구현하면서도 소비 전력을 최소화하는 것이 핵심 목표입니다. 일례로 저전력 기술이 없다면 에너지 효율이 떨어져 휴대폰을 한 시간에 한 번씩 충전하며 사용해야 하는 번거로움이 따를 것입니다. 제가 최근 집중하고 있는 뉴럴 네트워크 가속기 회로 및 시스템 설계 연구 역시 저전력이라는 큰 틀 안에서 진행됩니다. 특히 인공지능 연산을 보다 효율적으로 수행하기 위해 인공지능의 알고리즘과 하드웨어적인 시스템을 통합적으로 설계하는 데 초점을 맞추고 있습니다.
학위를 마치고 미국 아이비엠(IBM) 연구소에 재직하며 범용 마이크로프로세서 회로를 설계하였습니다. 당시는 컴퓨터가 처리해야 하는 데이터의 양이 폭발적으로 증가할 때로, 대규모 데이터를 효과적으로 다루는 기술에 자연스럽게 관심을 가졌던 것 같습니다. 특히 연구소 내에서‘트루노쓰(TrueNorth)’라는 프로젝트명의 뇌 모방 컴퓨팅 연구를 진행하던 동료들과 교류하며 관련 분야에 대한 흥미가 더욱 높아졌고요. 2013년 한국의 대학으로 자리를 옮기며 지도 학생들과 함께 관련 연구를 개척하고 계속해서 확장해왔습니다.
먼저 연구의 배경을 말씀드리면, 최근 인공지능(AI) 모델이 다양한 응용 분야에 사용되면서 높은 정확도 달성을 위해 모델의 규모가 점점 커지고 있습니다. 하지만 AI 모델이 커지면 연산에 필요한 메모리 용량과 컴퓨팅 자원이 함께 증가하고, 전력 소모도 증가합니다. 특히 메모리와 컴퓨팅 연산장치 간 대용량 데이터 통신이 필수적으로 뒤따릅니다. 즉, 이러한 대용량 데이터 이동에 따른 비효율성을 해결하는 방안 중 하나로 인공지능 모델의 정확도 저하를 최소화하면서 모델의 크기를 압축하여 줄이는 ‘경량화’연구가 주목 받고 있습니다. 경량화 기술은 최근 대규모 언어 모델(Large Language Model, LLM)의 크기가 기하급수로 커짐에 따라 AI의 지속적인 발전과 활용 확대를 위한 핵심 기술로 더욱 부각되고 있습니다.
인공지능 모델 경량화를 위한 전용 반도체 칩 관련 연구는 가변적인 비트 정밀도를 가지는 인공지능 모델을 하나의 가속기 회로로 지원하는 새로운 방식의 가속기 설계를 제안한 것으로 2022년 6월 반도체 회로 설계 분야의 국제학술지 ‘IEEE Journal of Solid-State Circuits’에 게재하였습니다. 기존의 반도체칩 설계는 각각의 정밀도를 지원하는 회로들을 독립적으로 구현하여 조합하는 방식이 일반적이었습니다. 반면 이번 연구는 전체 연산의 순서를 바꾸는 새로운 방법을 통해 이전 보다 간단한 연산기 구조를 사용하면서도 가변 정밀도를 효율적으로 지원할 수 있음을 입증하였습니다.
더불어 경량화 모델에 특화된 AI 반도체 가속기 설계 관련 성과는 2023년 5월 러닝머신 분야의 국제학술대회인 ‘ICLR 학회’에서 발표하였습니다. 이 연구에서는 최신 인공지능 모델 경량화 연산에 많이 쓰이는 정수형 변수와 정밀 부동소수점 변수 간의 연산이라는 새로운 방법을 제시하였습니다. 기존에는 연산의 정확도를 유지하기 위해 연산 면적과 전력 소모가 상대적으로 큰 부동소수점 연산기를 사용해야 한다는 통념이 지배적이었습니다. 하지만 이번 연구에서는 면적과 전력 부담이 작은 정수형 연산기를 사용하여도 동일한 수준의 연산 정확도를 달성할 수 있음을 최초로 증명하며, 후속 연구들에 중요한 방향성을 제시할 수 있었습니다.
인공지능 기술이 일상생활과 산업 전반에 빠르게 확산되면서 인공지능 모델 경량화 과 이를 지원하는 반도체 가속기 기술에 대한 사회적 관심도 높아졌습니다. 이들 기술이 산업에서 중요하게 활용되는 두 분야를 꼽자면, 하나는 인공지능 모델을 휴대폰 등 디지털 디바이스 내부에서 직접 구동시키는 온디바이스 AI(On-device AI)입니다. 관련 기술은 네트워크 연결 없이도 빠르고 효율적으로 AI 기능을 구현한다는 점에서 매우 중요합니다. 다음은 대규모 언어 모델(LLM) 분야로, LLM 운용에 막대한 연산량과 전력이 요구되기 때문입니다.
저희 연구실은 인공지능 모델 경량화 과 이를 지원하는 반도체 가속기 기술 연구를 선도해왔습니다. 최근 연구실 박사 졸업생 중 세 명이 관련 기술을 기반으로 졸업과 동시에 스타트업을 창업하였는데요. 업계에서 기술력을 높게 인정받는 것도 위에서 설명한 것과 같은 이유라고 생각됩니다. 또한, 2023년 발표한 ICLR 논문은 산학협력으로 진행된 공동연구의 결과로, 많은 기술 토론이 산업현장에서 요구하는 미래 기술 방향을 통찰하고 구체화하는데 도움이 되었습니다.
그동안 AI 모델 경량화 연구는 주로 소프트웨어 분야에서 활발히 진행되었습니다. 하지만 하드웨어의 특성을 충분히 고려하지 않고 경량화된 모델을 실제 하드웨어에서 실행할 경우, 경량화 전보다 오히려 연산성능이 저하되는 사례가 많았습니다. 반대로 하드웨어 분야에서는 AI 모델에 대한 충분한 이해 없이 하드웨어에서 동작시키기 편한 형태로 모델을 변형하는 경우도 종종 있었습니다. 두 경우 모두 실제 사용에는 한계가 있어 통합적인 하드웨어와 경량화 연구의 중요성이 크다고 생각했습니다. 저희 연구실도 처음에는 하드웨어 부분에 초점을 맞추었지만, 상대적으로 일찍 하드웨어 특성에 맞는 경량화 연구의 중요성을 깨닫고 통합 연구에 많은 노력을 기울였습니다. 아무래도 저의 학문적 배경이 하드웨어 설계이다 보니 모자란 점이 많았는데, 열정적으로 연구에 임해준 학생들의 노력 덕분에 함께 성장할 수 있었습니다.
AI 모델 경량화 연구를 시작할 무렵 인공지능분야 국제 학회에 참석해 제 관심 분야를 소개하면 대부분의 연구자들이 하드웨어에 대한 관심을 보이지 않아서 멋쩍었던 기억이 있습니다. 반대로 국내 반도체 기업 관계자들과 대화를 나누면, AI 반도체가 흥미롭긴 하지만 시장이 너무 작아 공을 들이기는 어렵다는 반응이 컸습니다. 이처럼 소프트웨어와 하드웨어 양쪽 모두에게 약간 미운 오리새끼(?) 취급을 받으면서도 개의치 않고 연구를 지속하였는데요. 그렇게 할 수 있었던 이유는 첫째는 연구 내용이 정말 재미있었기 때문이고, 둘째는 인공지능 컴퓨팅도 결국에는 기존 일반 컴퓨팅의 역사와 유사하게 더 작게, 더 저전력으로 발전할 것이란 믿음이 있었기 때문입니다. 물론 지금은 인공지능 국제학회에서도 하드웨어 관련 주제가 활발히 다뤄지고 있습니다. 또한 반도체 기업들도 인공지능 반도체를 열심히 연구개발하고 있어 연구자로서 매우 고무적이고 행복합니다.
인공지능 모델 경량와 및 가속기 설계와 관련한 연구결과는 과거 범용 컴퓨터가 휴대폰으로 발전해 손 안의 컴퓨팅을 가능하게 했던 역사와 유사한 흐름을 보일 것으로 생각합니다. 관련 기술을 통해 앞으로 휴대기기 또는 로봇과 같은 다양한 응용 환경에서도 인공지능 연산이 이루어지게 하는 발판이 될 것으로 기대합니다. 이러한 기술 발전을 통해 앞으로는 지금 우리가 생각지 못한 새로운 삶의 방식과 형태들이 다양하게 등장할 것으로 생각합니다.
말씀처럼 안정적인 연구를 위해서는 국가 R&D 지원사업 같은 외부 펀딩이 매우 중요합니다. 감사하게도 정부로부터 중견연구과제, 차세대 지능형 반도체 사업 등 여러 연구과제를 지속적으로 지원받은 것이 좋은 연구 결과를 도출하는 기반이 되었습니다. 또한 삼성미래기술육성센터로부터 오랜 기간 메모리 중심 인공지능 가속기 설계에 관한 연구지원을 받아 연구실 성장에 도움이 되었습니다.
경쟁력 있는 연구를 위해서는 단지 논문 발표만을 위한 연구가 아니라, 실제 산업 현장에서 쓰일 수 있는 연구를 하려고 노력합니다. 개인적으로는 가장 간단한 구조를 찾는데 많은 신경을 씁니다. 복잡한 구조로 아주 좋은 결과를 구현할 수 있다고 해도 실제 사용에는 한계가 있습니다. 때문에, 결과가 조금 덜 좋더라도 실제 산업에서 사용 가능한 단순한 구조를 고안하고 설계하는 것이 오히려 더 의미 있다고 생각합니다. 또한, 연구실 운영에 있어서도 구성원들이 본질적으로 중요한 연구에 집중할 수 있는 환경을 조성하려고 노력합니다. 중요성이 낮은 업무에 소모되는 시간을 줄이고 긴 호흡으로 깊이 있는 연구에 집중할 때 장기적으로 좋은 성과가 이어진다고 생각합니다.
저는 학생들이 이미 체계를 갖춘 기존 지식에 순응하기 보다는 해당 지식체계가 어떠한 역사적 흐름 속에서 성립되었는지 깊이 이해하려는 태도를 가지도록 장려합니다. 따라서 처음 연구실 생활을 시작할 때는 관련 분야의 배경을 먼저 충분히 공부하고, 연차가 올라가면서는 그러한 이해를 바탕으로 지도교수나 동료 연구자들과 함께 건강한 비판과 토론을 나누며 지적 성장을 이루는 과정을 중요하게 생각합니다. 이 같은 학습과 소통의 과정이야말로 창의적이고 주체적인 연구자로 성장하는 데 필요한 밑바탕이라고 믿고 있습니다.
연구자로 오랫동안 생활하면서 새로운 개념을 고안하고 실증하는 과정에서 많은 즐거움을 얻었습니다. 하지만 그 보다 더 큰 보람은 연구실 졸업생들이 학교, 창업, 취업 등 각자 꿈꿨던 방향으로 진출하여 독립적인 연구자로 성장하고, 타 연구자들에게 좋은 평가를 받을 때입니다. 제자들이 자립하여 연구자의 길을 개척해 나가는 모습을 지켜보는 것이 가장 행복한 순간입니다.
동일한 연산을 수행하는 데 필요한 컴퓨터의 전력 소모는 그동안 계속해서 작아진 반도체 덕분에 꾸준히 낮아졌습니다. 하지만 이제 물리적 한계로 반도체를 작게 만드는 게 어려워졌습니다. 따라서 이를 극복하기 위해 현재 수준보다 전력 소모가 극적으로 작은 컴퓨터를 구현하는 새로운 방향을 계속해서 고민하고 싶습니다.
어릴 적부터 ‘왜’라는 질문을 자주 던졌던 기억이 납니다. 우리 어린 학생들도 과학이나 사회 현상에 대해 호기심을 잃지 말고, 하나의 주제에 대해 자신 나름의 논리를 다듬어보는 기회를 많이 가졌으면 합니다. 그러한 경험과 태도가 과학자의 사고력과 창의력을 키우는 밑거름이 되리라 믿습니다.