과학기술정보통신부(장관 이종호, 이하 ‘과기정통부’)는 국내 인공지능 기술과 산업 발전을 견인할 인공지능 학습용 데이터 190종(5.8억건)을 인공지능 허브(aihub.or.kr)를 통해 7월 12일부터 추가 개방한다고 밝혔다.
그간 과기정통부는 ’17년부터 기업, 연구자 등이 시간·비용 문제 등으로 개별 확보하기 어려운 인공지능 학습용 데이터를 구축·개방해 왔고, ’20년부터 구축 규모를 대폭 늘린 후 18만건 이상의 다운로드를 기록 중이다.
이번 데이터 개방은 지난해 6월 개방한 ’20년 구축 데이터 170종(4.8억건)에 더하여 ’21년 구축한 190종에 대한 품질·활용성 검증을 거쳐 순차적으로 개방하는 것으로, 총 규모는 381종에 달하게 된다.
이번 데이터 개방과 함께 산·학·연 각 계 전문가가 인공지능 허브(AI Hub) 데이터 활용 촉진과 성과 확산 방안을 논의하는 ‘제3회 인공지능 데이터 활용협의회’를 박윤규 과기정통부 2차관 주재로 개최하였다.

이번에 개방되는 6대 분야 190종의 인공지능 학습용 데이터는 기획부터 구축까지 산업계, 전문가와 국민이 대거 참여한 결과물로 △한국어 음성·자연어(아동, 다화자 음성 등 44종) △영상·이미지(스포츠 동작, 반려동물 등 39종) △교통·물류(로봇주행, 교통사고 등 22종) △헬스케어(심장질환, 정신건강 등 32종) △재난·안전·환경(과적차량, 물류창고 등 27종) △농·축·수산(정밀 농업, 스마트 양식 등 26종) 등이다.
민간 수요를 바탕으로 분야별 산·학·연 전문가, 데이터 활용기업 등이 직접 참여하여 산업 파급효과가 크고 민간에서 대규모로 구축하기 어려운 데이터들을 발굴·선정하는 방식으로 기획되었다.
특히, 데이터 구축 과정에 국내 주요 인공지능·데이터 전문기업은 물론 대학(서울대, KAIST 등 118개), 병원(서울대병원, 국립암센터 등 50개) 등 총 811개 기업·기관과 4만 3천여명에 이르는 국민이 참여하였다.
정보통신기술 표준화·인증을 수행하는 한국정보통신기술협회(TTA)의 전문적 품질검증과 함께 실제 데이터 수요자가 요구하는 품질 수준을 확보하기 위하여, 주요 대기업(네이버·카카오·LG·KT·현대차 등), 스타트업(라이드플럭스·스트라드비젼 등), 대학 및 연구기관(GIST·부산대·ETRI·한국자동차연구원 등)의 데이터 활용성 검토와 추가 보완을 거쳤다.
과기정통부와 한국지능정보사회진흥원(이하, ‘지능정보원)은 데이터 개방 후에도 인공지능 허브(AI Hub) 내 품질 의견수렴 상시창구 운영, 한국정보과학회와 연계한 데이터 품질개선 연구 지원(7~12월) 등 민·관 협력을 통하여 데이터 품질과 활용성을 지속 관리·개선해나갈 계획이다.
관련기사
- 우리나라에 가장 필요한 것은 "기초연구에 대한 투자"
- 공공와이파이, 더 빨라지고 쾌적해져...6㎓ 대역 추가·10G급 초고속 연결
- 민간 중심 '새 우주 시대' 앞당긴다
- 과기정통부, '메타버스 개발자‧창작자 양성' 직접 챙긴다
- 민·관·군 협력해 '디지털 인재강국·과학기술 강군' 만든다
- 내년 연구개발 예산 '24.7조원'...'초격차 전략기술·탄소중립·디지털전환' 국정과제 중점 지원
- AI 반도체 기술 연구에 향후 5년간 1조 200억원 투입한다
- '뇌과학 선도융합기술개발 사업' 10년간 4500억원 지원
- 과기정통부, 산업별 민간연구개발협의체 5개 분야 확대 발족
- 안전한 데이터 거래와 활용위한 '데이터 가치평가' 및 '데이터 안심구역' 제도 본격 시행
- '초광역·강소' 전국 단위 디지털 생태계 조성한다
- 국산 달표면 무인 탐사 모빌리티 기술 개발된다
- SK텔레콤-서울대, ‘유동 인구 데이터 활용 연구’ 산학 협력
- 현대자동차, 대규모 R&D 경력자 채용...총 87개 분야, 세 자릿수 규모 채용
- 급성장하는 로봇 산업과 차량용 소프트웨어, 기업은 무엇을 준비하나
- KT, 상반기 역대 최대 매출...디지털 플랫폼 전환과 성장형 그룹 포트폴리오가 견인
- 링커버스-천주의성요한병원, 손톱 활용한 진단 공동연구
- '숫자연산 기계독해 데이터' 구축으로 인공지능 활용도↑
