인공지능(AI)에 대한 관심이 커지면서 관련 그래픽처리장치(GPU) 부족이 심각하다. 여기에 GPU를 독점 공급하는 엔비디아의 차세대 AI 반도체 '블랙웰' 최신 버전 출시도 예정보다 수개월 늦어지면서 엔비디아의 고성능 GPU 'H100'도 수개월 대기해야 확보할 수 있다.
가격도 한 개당 수천만원에 이를 정도로 고가라 자금력 없는 기업은 확보하기가 쉽지 않다. 여기에 소버린 AI 붐으로 각 국과 기업마다 제각각 대규모언어모델(LLM)을 만들고 있어 이를 학습시키기 위해 더많은 GPU와 AI칩이 요구되고 있다.
GPU 공급이 수요를 따라가지 못하면서 오픈 AI 등은 미국 반도체기업 브로드컴과 AI칩 개발에 나서는 등 글로벌 기업간 합종연횡도 거세다. 하지만 새로운 반도체 개발에는 최소 수개월에서 수십개월이 걸리는 데다 현장에서 실제 제대로 구동되는지 확인하는 절차를 거쳐야 해 당장 넘쳐나는 수요를 감당하기에는 어려울 전망이다.
이런 가운데 최근 국내 스타트업과 대기업이 손잡고 유휴 GPU를 활용한 공유 서비스를 내놓아 눈길을 끈다. 네이버클라우드와 중소 소프트웨어(SW) 업체 데이터얼라이언스가 내놓은 '지큐브(gcube)'는 유휴 GPU 공유 모델 서비스를 내놨다.
이들은 그간 시장에 많이 공급된 RTX 계열 GPU 장비 사용률이 낮다는 점에 착안해 새로운 서비스를 개발했다. RTX40 시리즈는 국내 PC방에 게임용 GPU로 상당수 설치됐다. PC방 사정에 따라 다르지만 GPU는 낮이나 특정 시간에는 가동되지 않는 경우가 많다. 이 유휴 GPU 자원을 모아 필요한 곳에 공유하자는 취지다. PC방은 새로운 수입을 확보하고, 서비스 이용자는 필요시마다 적정 가격에 GPU를 사용할 수 있다.
데이터얼라이언스에 따르면 RTX4070 60만장이면 광주 AI데이터센터의 300배에 달하는 연산 능력을 확보 할 만큼 유휴 GPU 활용 가치는 크다. 잘 연결만 되면 중소 IT업체나 새로운 AI서비스를 개발하는 기업에게 대안이 될 수 있다.
물론 유휴 GPU 공유가 공급 부족사태의 완벽한 대안은 될 수 없다. 하지만 지구의 한정된 자원을 아껴쓰고 나눠 쓰고 바꿔스고 다시 쓴다(아나바다)는 점에서 기후위기로 몸살을 앓는 지구를 살리는 데에서 모범이 될만하다. 또 이러한 시도를 기회로 AI시대에 발맞춘 새로운 대안들이 속속 등장해 공급난 해소에 한 몫 하길 기대해 본다.
Comments