조강원 대표, AI반도체포럼 강연

“비싼 엔비디아 GPU 탑재, 악순환”

딥시크 돌풍 예시…‘SW기술’ 강조

국내 인공지능(AI) 스타트업의 대표 주자로 꼽히는 ‘모레’가 AI 파운드리(위탁생산) 시장에서 ‘슈퍼 을’이 되겠다는 포부를 밝혔다. 하드웨어(HW) 문제를 해결하기 위해 매년 고가의 칩을 추가해야 하는 현재의 엔비디아 시스템에 분명한 한계가 있음을 지적하며, AI 산업에서 인프라 소프트웨어(SW)의 역할이 본질적으로 바뀌고 있음을 강조했다.

조강원 모레 대표는 11일 서울 강남구 그랜드 인터컨티넨탈 서울 파르나스에서 열린 인공지능반도체포럼 조찬 강연회에서 “AI 컴퓨팅 인프라 본질은 SW”라며 “모레는 고객사들로 하여금 다양한 AI 가속기에 대한 옵션을 제공하고, LLM(거대언어모델)을 개발하는 시간과 비용을 크게 줄여주는 것이 목표”라고 말했다.

AI 인프라 솔루션 기업 ‘모레’는 최근 영국 벤처 전문 미디어가 꼽은 ‘실리콘밸리 거물들과 경쟁하는 미국 외 지역의 글로벌 AI 스타트업’ 중 한곳으로 거론됐다. 2020년 설립된 후 AMD, KT 등으로부터 2200만달러 규모의 시리즈B투자를 유치했다. 현재 한국 80여명, 베트남 20여명 등 약 100명의 소프트웨어 엔지니어가 근무하고 있다.

현재 AI 시장은 엔비디아의 GPU, AI 가속기 등 HW를 탑재하고 엔비디아의 개발 플랫폼인 ‘쿠다(CUDA)’를 통해 모델을 개발하고 고도화해야 하는 시스템이다. 문제는 GPU 등의 가격이 매년 천정부지로 높아지고 있고, HW로 문제를 해결하는 것에 기술적 한계가 오고 있다는 점이다.

조 대표는 “엔비디아는 기존 HW에서 문제가 생기면 이걸 해결할 수 있는 새로운 HW를 추가하는 방식으로 지난 7~8년 동안 문제를 해결해왔다”며 “그러다보니 고객이 필요로 하지 않는 리치한(과도한) HW가 들어가게 돼고 SW 자동화가 어려워지는 악순환으로 이어지고 있어 얼마나 지속 가능할지 우려되는 상황”이라고 했다.

이에 모레는 HW가 아닌 SW 기술을 통해 AI 모델 효율을 높이고 비용도 줄이는 것을 꾀하고 있다. 조 대표는 딥시크 돌풍을 SW를 통한 AI 성능 강화의 예로 들었다. 그는 “딥시크 성공 요인은 새롭지 않은 요소 기술을 어떤 식으로 조합했을 때 좋은 모델을 만들 수 있는지 찾아낸 것”이라며 “좋은 조합을 빠르게 찾아낼 수 있었던 비결은 결국 컴퓨팅 인프라를 효율적으로 잘 썼기 때문”이라고 했다. 이어 “컴퓨팅 인프라 성능을 좌우하는 것은 SW”라며 “SW를 통해 수천개의 GPU를 한개의 단일 시스템으로 묶어서 작동시킬 수 있다”고 덧붙였다.

모레는 엔비디아 GPU가 아닌 AMD GPU나 효율적인 신경망처리장치(NPU) 등 다양한 AI 가속기 지원을 원하는 고객을 위해 호환성 높은 SW를 개발하고 있다. 그는 “저희 SW를 활용하면 AMD GPU를 탑재해도 엔비디아 제품을 탑재했을 때보다 110~120%의 성능과 가격 효율을 구현할 수 있다”며 “LLM을 개발하는 시간도 통상 5~6개월에서 1~2주로 단축하는 것이 목표며, 비용도 크게 줄일 수 있다”고 강조했다.

엔비디아 쿠다를 대체할 수 있는 자체 SW 모델도 개발 중이다. 지난해 1월 처음 개발한 모모(MoMo)-70B 모델과 지난해 12월 자체 개발한 한국어 LLM인 ‘Motif(모티프)-102B’이 대표적이다.

조 대표는 AI의 미래는 각 고객사가 원하는 모델을 만들어주는 ‘파운드리(위탁생산)’ 형태로 흘러갈 것이라고 전망했다. 그는 “파운드리 체인에서 기술적으로 가장 큰 병목은 네덜란드의 ASML인 것처럼, AI 시장에서도 결국 인프라를 잘 돌리는 SW 기술이 병목이 될 것”이라며 “모레가 그 영역을 하려고 하고 있는 거고, 다른 많은 한국 기업이 AI나 인프라 쪽에서 기회를 찾을 수 있었으면 좋겠다”고 말했다. 김민지 기자


jakmeen@heraldcorp.com