환경 조건이 거의 매일 바뀌는 기후 과학에서 최신 데이터에 대한 액세스는 중요한 과제다. 데이터의 양은 꾸준히 증가하고 있어, NASA의 추정에 따르면 2024년까지 새로운 임무에 대해 25만 테라바이트의 데이터를 갖게 될 상황인데, 과학자와 연구원들은 이러한 대규모 데이터 세트를 분석하는 데 어려움을 겪고 있다.

NASA와 IBM은 우주 개발 협약(Space Act Agreement)의 일환으로 2023년 초 지리 공간 데이터를 위한 AI 기반 모델을 구축하기 시작했다. 

최근 IBM과 오픈 소스 AI 플랫폼인 허깅 페이스(Hugging Face)는 NASA의 위성 데이터를 기반으로 구축된 IBM의 왓슨x.ai(watsonx.ai) 지리 공간 기반 모델을 허깅 페이스에서 공개적으로 이용할 수 있다고 발표했다. 이 모델은 허깅 페이스에서 가장 큰 지리 공간 기반 모델이자 NASA와 공동으로 구축한 오픈 소스 AI 기반 모델이 될 것이다.

NASA의 위성 데이터 기반으로 구축된 IBM의 왓슨x.ai가 공개됐다. (자료제공=IBM)
NASA의 위성 데이터 기반으로 구축된 IBM의 왓슨x.ai가 공개됐다. (자료제공=IBM)

미국 전역에서 1년 동안 HLS(Harmonized Landsat Sentinel-2 위성 데이터)에 대해 IBM과 NASA가 공동으로 훈련하고 홍수와 화재 현장 매핑을 위해 레이블 데이터를 미세 조정한 이 모델은 레이블이 지정된 데이터의 절반을 사용하는 최신 기술보다 15% 개선된 것으로 나타났다.

추가적인 미세 조정을 통해 삼림 벌채 추적, 작물 수확량 예측, 온실 가스 감지 및 모니터링과 같은 작업을 위해 기본 모델을 재배치할 수 있다. IBM과 NASA 연구원들은 클라크대학교와 협력해 시계열 분할 및 유사성 연구와 같은 용도로 모델을 조정하고 있다.

한편 IBM 왓슨x의 일부인 공간 모델의 상업적인 버전은 올해 말에 IBM EIS(Environmental Intelligence Suite)를 통해 이용할 수 있다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지