인공지능(AI) 기반 교육기술 기업 뤼이드(www.riiid.com, 대표 장영준)가 개발한 생성AI 모델이 4일 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 LLM (Large Language Model, AI 거대 언어 모델) 리더보드' 평가에서 74.07점을 기록하며 글로벌 1위에 오르는 기염을 토했다.
오픈AI, 구글, 아마존 등 글로벌 빅테크들의 초거대 AI 언어모델들이 미래 시장을 두고 치열한 경쟁 중인 가운데, 전세계 500여 개의 오픈소스 생성 AI 모델들의 성능을 평가해 순위를 공개하는 허깅페이스의 오픈 LLM 리더보드는 하루에도 수십개 씩 새로운 모델이 나올 정도로 치열한 전세계 AI 기술 경쟁의 각축장이다. 평가 지표는 총 4가지로, 초등학교 수준의 과학 추론 능력, 인간에게는 쉽지만 AI 모델에게는 까다로운 상식 능력, 초등 수학, 미국 역사, 컴퓨터 과학, 법률 등을 포함한 종합적 언어 이해 능력, 환각현상(할루시네이션) 방지를 위한 진실성 검사 등 이들 지표의 평균 점수를 통해 종합 점수와 순위가 정해진다. 뤼이드는 4가지 지표 모두 고른 고득점을 얻어 종합 점수에서 최고점을 기록했다.
현재 상위권 주요 참가팀을 살펴보면, 2위는 대만 항공우주 회사, 3위는 중국 알리바바와 서북공업대(Northwestern polytechnical university) 연합 모델, 5위는 중국 연합통신으로 추정된다. 각 참가자들이 공식적인 정보를 공개하지 않아 모델명으로 추정할 수 밖에 없다. 이외에도 이미지 생성 AI인 '스테이블디퓨전' 개발사 '스태빌리티 AI'의 LLM이 71.42로 47위를 기록중이며, 메타의 '라마-2'는 67.35점으로 106위에 랭크되어 있다.
이 리더보드는 상시 오픈 상태로, 참가기업이나 개인이 자체 LLM을 제출하면 평가 후 바로 리더 보드가 갱신된다. 국내에서는 지난 8월 AI 기술 기업 업스테이지가 챗GPT 3.5 모델을 누르고, 전세계 1위를 차지해 주목받았으며, 현재 14위를 기록중이다. 뤼이드는 지난 9월 처음으로 제출한 모델이 73.69점을 기록, 세계 2위에 랭크되었으며, 이번에 한 달 만에 새로 제출한 모델이 74.07점을 받아 1위에 올랐다.
장영준 뤼이드 대표는 "이번 1위를 통해 교육 분야에 국한되지 않은 AI 기술 기업으로서 LLM 학습 능력과 튜닝 기술이 세계 선두에 있음을 증명했다"며, "그간의 교육학습 AI 운영으로 축적된 프롬프트 엔지니어링이 파인튜닝 기술과 좋은 시너지를 발생시킬 것으로 기대된다"고 밝혔다.
뤼이드는 최근 브라질 공교육에 AI 기술을 제공하는 MOU를 체결하는 등 글로벌 비즈니스 성과를 쌓아가는 동시에, 꾸준히 국제 학회에 최신 AI 기술 논문을 발표하며, 학술적으로도 최고의 AI 기술 경쟁력을 이끌어가고 있다.
보도자료 제공: 뤼이드