산업 전반에 걸친 AI의 급속한 도입으로 기업들의 37%가 AI 프로젝트 구현 시 데이터를 최우선 고려 사항으로 꼽았다. 하지만 적절한 데이터 품질과 관리를 보장하기 위한 조치를 취하고 있는 IT 리더는 찾아보기 힘든 것으로 나타났다.

이는 히타치의 데이터 저장, 인프라 및 하이브리드 클라우드 관리 업체인 히타치 밴타라(Hitachi Vantara)가 실시한 데이터 인프라에 대한 설문조사 결과 드러났다. 히타치 밴타라는 15개국에 걸쳐 1200명의 최고경영진 및 IT 의사결정권자를 대상으로 설문조사를 실시했다.

고품질 데이터 사용이 AI 성공 좌우

조사 결과에 따르면, ‘고품질 데이터 사용’은 미국과 전 세계 모두에서 AI 프로젝트 성공의 가장 큰 이유인 것으로 나타났다. 미국 응답자의 41%가 이에 동의했다. 그러나 AI로 인해 기업들이 필요로 하는 데이터 저장량이 극적으로 증가했으며, 데이터 양은 2026년까지 122% 증가할 것으로 예상된다. 결과적으로, AI 모델에 사용하기 위해 데이터를 저장, 관리 및 태깅하는 것이 더욱 어려워지고 있다.

적절한 데이터 관리와의 단절을 보여주듯, 응답자의 38%만이 필요할 때 대부분 데이터를 사용할 수 있다고 응답했다. AI 모델 출력의 대부분이 정확하다고 답한 비율은 33%였으며, 응답자의 80%는 대부분의 데이터가 비정형이라고 말해 데이터 볼륨이 폭발적으로 증가함에 따라 더 큰 위험을 초래하고 있는 것으로 분석됐다.

응답자의 47%는 시각화를 위해 데이터에 태그를 붙이지 않고, 37%만이 AI 출력을 설명하기 위해 교육 데이터 품질을 향상시키고 있으며, 26%는 품질을 위해 데이터세트를 검토하지 않는다고 답했다.

보안은 최우선 고려 항목이다. 응답자의 54%가 인프라에서 데이터 저장 보안을 가장 우려되는 영역으로 꼽았으며, 이는 전 세계 평균인 37%보다 17% 포인트나 높은 수치이다. 또한 응답자의 74%는 심각한 데이터 손실이 운영에 치명적일 수 있음을 인정했고, 73%는 AI가 해커에게 향상된 도구를 제공할 것을 걱정하고 있다.

AI 전략에는 투자 수익률(ROI) 분석이나 지속 가능성 고려가 부족한 것으로 보인다. 32%만이 AI 구현에서 지속 가능성을 우선순위로 선정했으며, ROI를 우선시한다고 응답한 비율은 30%였다.

대규모 모델이 일반 모델보다 훈련에 최대 100배 더 많은 전력을 소비함에도 불구하고, 대규모 조직의 61%가 소규모의 전문 모델보다는 일반적이고 대규모인 대규모 언어 모델(LLM) 개발에 집중하고 있는 것으로 드러났다.

히타치 밴타라의 비즈니스 전략 수석 부사장 사이먼 니난(Simon Ninan)은 “많은 사람들이 뒤처지지 않기 위해 정의된 전략이나 결과 없이 AI에 뛰어들고 있지만, AI의 성공은 명확하게 정의된 사용 사례와 ROI 목표를 가지고 프로젝트를 시작하는 것을 포함한 여러 핵심 요인에 달려 있다.

또한 데이터 복원력과 에너지 효율성을 우선시하는 방식으로 대규모 데이터 세트를 처리할 수 있는 현대적 인프라에 투자해야 한다. 장기적으로 지속 가능성을 고려하지 않고 구축된 인프라는 향후 지속 가능성 규정을 준수하기 위해 재건설해야 할 가능성이 높다.”고 지적했다.

AI 성공에서 데이터 인프라가 중요한 이유

성공적인 AI를 위한 최우선 고려 사항이 데이터 품질이라고 알고 있음에도 불구하고, 많은 조직들은 일관된 데이터 품질 표준을 지원할 인프라가 부족하다.

기업의 74%가 통제된 환경 없이 실시간으로 AI를 테스트하고 반복하고 있어, 상당한 위험과 잠재적 취약성의 여지를 남기고 있다. 3%만이 AI 실험을 포함하기 위해 샌드박스를 사용하고 있어, 보안 침해와 결함 있는 데이터 출력 가능성에 대한 우려가 제기된다.

현대적 인프라는 더 에너지 효율적으로 설계되어 있어 조직이 성능을 개선하는 동시에 탄소 발자국를 줄일 수 있는 해결책을 제공한다. 지속 가능하고 첨단의 인프라를 채택함으로써 기업들은 데이터 품질을 향상시키고, 위험을 완화하며, 환경적으로 책임 있는 AI 성장을 지원할 수 있다.

신뢰할 수 있는 파트너

설문조사에 따르면 조직들이 AI 이니셔티브를 진전시키면서 대부분의 IT 리더들은 핵심 영역에서 제3자 지원의 필요성을 인식하고 있다.

하드웨어는 보안성이 있고, 24시간 가용하며, 지속 가능성 목표를 충족할 수 있어야 한다. 응답자의 22%는 확장 가능하고 미래 대비형 하드웨어 솔루션을 만드는 데 도움이 필요하다고 답했다.

효과적인 데이터 솔루션은 보안과 지속 가능성을 해결하면서 데이터를 사용자에게 더 가깝게 제공한다. 설문조사에 따르면 41%의 리더들이 ROT 데이터 저장 및 데이터 준비에 대한 도움이 필요하며, 25%는 데이터 처리 지원을 필요로 하고 있다.

안전하고 복원력 있는 소프트웨어는 사이버 위험으로부터 보호하고 데이터 접근성을 보장하는 데 중요하다. IT 리더의 31%가 효과적인 AI 모델 개발을 위해 제3자 전문성을 필요로 한다.

기술 격차는 여전히 장애물로 남아있으며, 리더의 50%가 실험을 통해 AI 기술을 구축하고 36%는 자기 학습에 의존하고 있다고 답했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지