내년도의 데이터 관리 추세는 EU의 디지털 서비스법(Digital Service Act, 이하 DSA) 패키지의 영향부터 데이터 관리에 초점을 맞춘 챗GPT의 새로운 변화에 이르기까지 다양할 것으로 예상된다. 데이터 관리(Data Management, DM)는 데이터의 수집, 처리, 저장뿐만 아니라 사람들의 권리를 보호하는 법률 및 규정을 다룬다. 조직의 데이터 관리에는 광범위한 관행, 정책, 절차가 포함된다.

IT전문 교육 업체 데이터버시티(Dataversity)가 2024년 데이터 관리 프로세스에 대한 전망을 발표했다.

데이터 관리의 목표는 사람들이 작업과 프로젝트를 완료하도록 지원하고 데이터를 비용 효율적으로 사용하는 것이다. 강력한 DM 전략을 개발하는 것은 조직에 매우 중요하다. 강력한 DM 전략에는 다양한 DM 도구와 기술이 포함돼야 하며 비즈니스 인텔리전스와 분석을 지원해야 한다.

데이터 관리 시스템은 전통적으로 데이터베이스, 데이터 웨어하우스, 데이터 레이크, 데이터 분석, 데이터 통합 등을 지원하는 소프트웨어를 포함하는 DM 플랫폼을 중심으로 개발됐다.

올바른 계획을 통해 기술 및 규정의 변화에 대비할 수 있다.

EU DSA 패키지의 영향

내년에는 EU가 개발하고 제정한 DSA 패키지의 영향을 받을 것으로 보인다. EU은 미국과 달리, 시민을 보호하기 위해 디지털 서비스법 및 디지털 시장법(DSA 패키지라고도 함)이라는 추가 규정을 시행했다. 이러한 규정들은 온라인 활동을 더욱 안전하게 만들고 소비자와 사용자의 권리를 보호합니다. 이는 2024년 3월 6일부터 시행된다.

DSA 패키지는 사용자의 권리를 보호하고 공정한 경쟁의 장을 마련해 페이스북이나 트위터, 구글, 기타 월간 사용자 수가 4500만 명 이상인 웹사이트 등 몇몇 대규모 플랫폼의 영향을 줄일 수 있다.

개발 과정에서 중요하게 우려했던 사항은 아동 포르노, 총기, 해킹 서비스 등 불법 콘텐츠, 상품 및 서비스를 온라인으로 판매하는 것이었다. 잘못된 정보를 확산시키기 위한 조작된 알고리듬 시스템에 의해 온라인 서비스가 남용된다는 우려도 있다.

DSA  패키지는 역외 적용 범위를 가지며 전 세계 비즈니스에 영향을 미칠 것이다. 유럽 고객과 거래하는 조직이라면, 해당 조직이 유럽에 위치하지 않더라도 유럽연합 내의 사람 또는 기업과 거래할 때 DSA 규칙을 따라야 한다. 패키지의 대부분은 대규모 온라인 플랫폼을 규제하지만 소규모 기업도 영향을 받는다.

소규모 기업은 DSA 패키지가 유럽 소비자를 콘텐츠(잘못된 정보 관련), 온라인 상품 및 서비스(불법 활동 관련)에 연결하는 모든 디지털 서비스에 적용된다는 점을 인식해야 한다.

EU에서 비즈니스를 수행하는 조직은 위험 평가 및 대응, 피해 감소, 온라인 사용자 권리 보호, 더 광범위한 책임 및 투명성 책임 이행과 관련된 새로운 의무를 충족해야 한다. 이러한 규정은 인터넷 사용자에게 새로운 보호를 제공하고 인터넷에서 비즈니스를 하는 조직의 법적 책임을 명확히 하기 위한 것이다.

자동화된 데이터 관리

자동화된 데이터 관리 도구를 설치하는 것은 복잡한 프로세스일 수 있지만 제대로 설치하면 효율성이 향상되고 비용이 절감되며 지루한 수작업이 제거된다.

다음은 조직에서 사용하기 시작한 자동화된 프로세스 중 일부다.

① 데이터 수집 : 데이터베이스, 문서, 기타 웹사이트 등 다양한 소스에서 데이터를 수집한다.

② 데이터 통합 : 데이터를 수집해 적절한 형식으로 변환하고 단일 저장소에 저장한다.

③ 데이터 정리 : 중복된 기록을 제거하고, 데이터 형식을 표준화하며, 오류를 수정한다.

④ 데이터 처리 및 분석 : 알고리듬이나 머신러닝을 사용해 데이터에서 통찰력을 확보한다.

⑤ 데이터 거버넌스 : 비즈니스 정책 및 정부 규정에 따라 데이터를 처리한다.

매일 엄청난 양의 데이터를 효율적으로 관리하려면 소프트웨어 기반 자동화 도구가 조직의 DM 프로세스에 포함돼야 한다. 2024년에는 AI와 머신러닝이 가치 있는 자동화 서비스를 제공할 것으로 예상된다.

데이터 관리로 의료 서비스 극대화

은행이나 소매업계와 달리 의료계는 아직까지 데이터 분석이나 빅데이터 연구를 충분히 활용하지 못하고 있다. 이는 환자의 개인정보 보호와 이익에 대한 인식 부족 등 다양한 이유가 있다.

하지만 의료계도 데이터 분석과 빅데이터를 활용하기 시작했다. 일례로, 프랑스의 APHP(Assistance Publique-Hôpitaux de Paris)의 회원인 4개 병원은 지난 10년간의 병원 입원 기록을 사용해 각 시설에서 예상할 수 있는 환자 수를 시간별, 일별로 예측했다. 분석 결과 입원률에 관련 패턴이 나타났다.

의료 산업에서 데이터 분석은 실시간 경고에 사용될 수 있다. 병원에서는 현장에서 의료 데이터를 분석해 의료 전문가가 처방을 내릴 때 조언을 제공하는 CDS(임상 결정 지원) 소프트웨어를 사용하기 시작했다.

2023년 11월 11일, 미국 재향군인회는 백만 번째 재향 군인 프로그램을 지원하는 유전자 데이터베이스에 백만 번째 재향 군인을 입력했다. ​​이 데이터 기반 연구는 유전자, 군대 노출 및 생활 습관 행동이 사람들의 건강에 어떻게 영향을 미치는지 더 잘 이해하고 개별화된 의약품을 제공하는 것이 목표다.

하이브리드/멀티 클라우드 보안을 위한 데이터 관리

2024년에는 데이터 관리 시스템이 하이브리드 클라우드 보안을 제공하고 데이터를 보호하는 방법으로 암호화, 사이버 보안 메시 아키텍처, 네트워크 세분화를 사용할 것으로 예상된다.

최근 하이브리드 클라우드의 정의가, 온프레미스 시스템과 퍼블릭 클라우드를 결합한 것에서 멀티클라우드 시스템을 포함하는 것으로 확대되고 있다. 하이브리드 클라우드는 전문 도구에 대한 액세스를 제공하는 유연한 시스템을 지원한다.

하지만 하이브리드/멀티 클라우드 시스템을 사용하는 과정에는 몇 가지 보안 문제가 따른다.

여러 클라우드를 사용하면 관리와 보안 측면에서 복잡해진다. 다양한 클라우드 서비스의 사용을 추적하고 모니터링할 수 있는 적절한 절차가 없으면 관리자는 누가 리소스를 사용하고 있는지 알 수 없다.

또한 청구서를 받기 전까지는 언제 사용되는지 알 수 없다. 여러 애플리케이션이 온프레미스 시스템과 멀티 클라우드를 사용해 데이터에 액세스하고 작업하기 때문에 관찰 가능성이 매우 중요하다. 이 경우 관찰 가능성은 여러 클라우드와 내부 시스템에서 데이터와 이벤트를 모니터링하는 기능을 뜻한다.

또 다른 우려 사항은 클라우드마다 서로 다른 형태의 보안을 사용한다는 것이다. 프로젝트 작업을 위해 조직에서 사용하는 모든 클라우드를 상호 연결하는 시스템을 개발하면 연결할 때마다 침해될 수 있다는 점에서 심각한 보안 문제를 야기한다.

하이브리드/멀티 클라우드는 다양한 환경 간에 워크로드를 신속하게 이동하는 데 상당히 유연하지만 이 프로세스로 인해 보안 위험도 증가한다.

AI를 활용한 데이터 관리

데이터 관리 목적으로 AI를 사용하는 것은 계속 증가할 것이다. 2023년 이전에는 AI가 더욱 지능적인 형태의 자동화된 DM 프로세스를 만드는 역할을 했다.

AI는 이상 탐지, 메타데이터 관리, 메타데이터 자동 검색, 데이터 카탈로그화, 데이터 매핑, 데이터 거버넌스 제어 모니터링 등의 DM 작업에 사용되고 있다.

챗GPT의 도입과 이를 지원하는 대형 언어 모델을 통해 지능형 학습 기반 서비스를 제공하는 새로운 솔루션을 기대할 수 있다. 대형 언어 모델이 계속 발전함에 따라 데이터 관리 프로세스를 지원하는 서비스도 계속해서 발전할 것으로 전망된다. 챗GPT 개발을 담당하는 조직인 오픈AI는 데이터 관리를 실험하고 있다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지