과기정통부, ‘23년도 인공지능학습용데이터 구축사업 공모
상태바
과기정통부, ‘23년도 인공지능학습용데이터 구축사업 공모
  • 박세아 기자
  • 승인 2023.04.14 13:24
  • 댓글 0
이 기사를 공유합니다

인공지능 학습용데이터 구축사업에 2,805억 원 투입
거대언어모델 지원 위한 말뭉치 데이터 34종 구축 추진
출처: 과학기술정보통신부
출처: 과학기술정보통신부

[애틀러스리뷰=박세아 기자] 과학기술정보통신부(장관 이종호, 이하 과기정통부)는 4월 14일부터 5월 19일까지 인공지능 학습용데이터 구축사업(이하 구축사업) 참여사업자를 공모한다고 14일 밝혔다.

과기정통부는 2017년부터 언어, 이미지, 영상, 음성, 센서 등 다양한 유형의 인공지능 학습데이터를 구축해 누구나 손쉽게 활용할 수 있도록 지원하고 있다. 

현재 AI 허브를 통해 한국어, 헬스케어, 교통 등 6대 분야 381종의 데이터를 제공 중이며, 이달 말부터는 지난해 구축한 310종을 품질검증을 거쳐 순차적으로 추가 개방할 예정이다.

올해 구축사업에는 총 2,805억 원 예산을 투입해 150종의 신규 데이터를 구축하며, 지난해 수요조사를 통해 접수된 약 1천 4백 건의 후보데이터를 토대로 기획된 130종의 데이터는 지정과제 형태로 추진한다.

지정과제는 ‘22년 1월 수립한 AI 학습용 데이터 구축·활용 고도화 방안에 따라 선정된 14대 분야 118종의 데이터와 ‘22년도 계속과제 12종으로 구성된다. 나머지 20종은 자유과제로 지역특화, 자유주제 등 일반영역과 초거대AI 영역으로 나눠 선정할 예정이다.

특히 올해는 챗GPT와 같은 초거대AI에 기반한 대화형 모델 지원을 위한 데이터 구축도 추진한다. 기존 지도학습용 데이터(라벨링데이터) 물량은 일부 축소하고, 한국어 21종 등을 포함한 총 34종의 데이터를 ‘초거대AI 지원 데이터’로 구분해 자기지도학습에 필요한 비라벨링 데이터 구축을 확대한다.

이 사업은 인공지능 학습데이터를 활용하는 전문기업과 데이터 수집‧보유‧가공 등의 구축 역량을 갖춘 2개 이상의 기업‧기관 등이 컨소시엄을 구성하여 참여할 수 있으며, 총 114개의 신규 주관기관을 선정할 예정이다.

박윤규 제2차관은 “새로운 AI 기술이 등장하면서 양질의 대규모 데이터 확보는 어느 때보다 중요해지고 있다”며 “혁신적인 아이디어를 가진 많은 기업들이 인공지능 도입‧개발에 적극 도전할 수 있도록 고품질의 데이터 인프라를 조성함으로써 국민들이 생활 속 더욱 다양한 인공지능 혜택을 누릴 수 있는 기반을 다져 나가겠다”고 말했다.


당신만 안 본 뉴스
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.