한국전자통신연구원, 초고속 생성형 시각지능 모델 개발
적극 공개 및 공유로 국내 인공지능 생태계 활성화 도모
바야흐로 ‘AI 시대’다. 업계 선두주자인 ‘Open AI’사의 대화형 인공지능 ‘챗지피티’를 시작으로 굴지의 대기업들이 인공지능 개발에 사활을 걸고 있는 상황에서 국내 연구진이 주목할만한 인공지능을 개발했다.
한국전자통신연구원(ETRI)은 최근 생성형 인공지능과 시각지능 기술을 결합해 문장입력 시 2초 만에 이미지를 만드는 기술을 일반에 공개했다.
연구진은 문장을 입력해 이미지를 만드는 AI ‘코알라(KOALA)’ 모델의 경량화에 성공했다. 서비스의 속도 저하와 운영 비용 증가의 원인인 파라미터를 경량화해서 모델 크기를 1/3로 축소했고, 이로 인해 고해상도 이미지가 종전 대비 2배, 챗지피티의 ‘달리3’ 보다 5배나 더 빠르게 생성된다고 한다. 또한, 8GB의 저용량 메모리를 갖는 저가의 GPU(그래픽 처리장치)에서도 구동할 수 있게 된다.
실제로 연구진이 “달 아래 화성에서 책을 읽고 있는 우주 비행사의 사진”이라는 문장을 입력하자 ETRI가 개발한 코알라 모델은 1.6초 만에 이미지를 만들어 냈고, 칼로(카카오 브레인)은 3.8초, 달리 2는 12.3초, 달리 3는 13.7초가 걸렸다.
연구진은 챗지피티 같은 대화형 인공지능에 시각지능 기술을 더해 이미지나 영상을 불러와 그에 대해 한글로 질의응답이 가능한 ‘코라바(Ko-LLava)’ 모델도 함께 공개했다.
ETRI에 따르면, 달리 2와 3등 여타 9개 모델을 비교하고 체험해볼 수 있는 사이트 및 모델제공 사이트를 만들어 제공하고 공개 이후에는 이미지 생성과 창작 교육 서비스, 콘텐츠 제작 및 사업자 등에 기술이전 할 계획이다.
ETRI측은 “수천 대의 서버가 필요한 모델들의 크기를 줄여 중소기업의 이용을 활성화해 관련 생태계를 조성하기 위해 적극적인 기술 공개 및 공유를 하게 됐다"고 밝혔다. ETRI 관계자는 “향후 다양한 시도를 통해 크기는 작지만, 성능은 뛰어난 다양한 모델을 공개할 예정”이라면서 “기존 거대 모델들에 대한 의존성을 탈피하고 국내 중소기업이 인공지능 기술을 효과적으로 이용할 기회를 제공할 것”이라 덧붙였다.
이에 대해 대학생 유모(25) 씨는 “유튜브에서 챗지피티의 ‘달리’를 통해 그림을 그리는 콘텐츠가 많아 관심이 생겼는데, 그보다 훨씬 빠른 AI가 한국에서 개발됐고 적극적으로 공유한다니 정말 좋은 소식”이라며 큰 기대감을 보였다.