로앤컴퍼니가 법률 AI 연구 생태계 활성화를 위해 법률 AI 데이터셋을 공개하고 AI 모델 개발 능력을 겨루는 경진대회를 개최한다.
법률서비스 플랫폼 ‘로톡(LawTalk)’ 운영사 로앤컴퍼니(대표 김본환)는 법률 AI 데이터셋 클레이드(KLAID, Korean Legal AI Datasets)를 무료로 공개하고 다음 달 4일까지 AI 모델 개발 경진대회 ‘클레이드 챌린지 2022’를 개최한다. 클레이드는 로앤컴퍼니가 자체 보유한 데이터를 기반으로 만든 ‘한국어 법률 AI 데이터셋‘이다.
이번에 공개하는 데이터셋은 로앤컴퍼니가 보유한 약 320만 건의 판결문 중 55만 건의 1심 형사사건을 분석해 뽑아낸 ‘형사 범죄 분류’ 데이터 16만 건으로, 범죄사실과 그에 따른 적용법조를 하나의 쌍으로 구성했다. 또한 시기별로 다를 수 있는 적용법조를 최신 법 개정에 맞춰 일원화해 AI 연구자들의 데이터셋 활용이 용이하도록 했다.
해당 데이터를 활용하면 피고인의 범죄사실에 대해 위반한 법령을 추측하는 AI 모델을 개발할 수 있다. 로앤컴퍼니는 대회 참가자들로부터 AI 모델을 제출받아 해당 모델이 얼마나 정확하게 범죄를 분류하는지 점수화해 홈페이지 리더보드에서 결과를 공개할 예정이다.
김본환 로앤컴퍼니 대표는 “해외에 비해 열악한 국내 법률 AI 연구 환경에서 국내 최다 규모의 법률 AI 데이터셋을 개방해 인공지능 연구자들에게 활발한 연구 개발의 장을 마련했다는 점에 의미가 크다고 생각한다”며, “리걸테크 대표 기업으로서 향후 적극적인 연구 지원 활동을 모색해 법률 AI 연구 생태계 활성화에 앞장서 리걸테크 산업 발전에 기여하겠다.”고 밝혔다.
로앤컴퍼니는 앞으로도 법률 AI 데이터셋 공개 범위를 넓혀 시리즈로 추가 공개하고, 주기적인 경진대회를 개최해 법률 AI 연구에 대한 일반 연구자의 관심을 확대해 나갈 계획이다.
이번 경진대회는 AI 모델 개발에 관심 있는 대학(원)생이라면 클레이드 홈페이지에서 개인 또는 팀으로 자유롭게 응모할 수 있다. 참여자 중 AI 모델 평가에서 가장 높은 점수를 기록한 1명(팀)에게는 총 300만 원의 상금이 수여되며, 최종 수상자는 12월 22일 홈페이지를 통해 발표, 시상은 12월 29일이다.
대회에 참가하지 않더라도 AI 연구자라면 누구든지 기간에 상관없이 클레이드 홈페이지에서 데이터셋을 다운로드받아 AI 모델을 만들 수 있다.
이미지 제공 : 로앤컴퍼니
로톡 : https://www.lawtalk.co.kr/
클레이드 : https://klaid.net/
Thanks for sharing. I read many of your blog posts, cool, your blog is very good.
Can you be more specific about the content of your article? After reading it, I still have some doubts. Hope you can help me.