
의학 연구는 역동적이고 방대하기 때문에 기관들은 너무 많은 데이터 관리 솔루션을 실험하는 것에 대해 우려해 왔다. 노출 위험, 궁극적으로 환자 데이터 기밀 침해로 인해 큰 피해를 입을 수 있기 때문이다. 동시에 데이터가 의료의 미래를 형성하는 데 없어서는 안 될 역할을 한다는 사실은 부인할 수 없다.
고품질의 시기적절한 치료를 시행하려면 주문형 데이터에 대한 통찰력이 필요하며 이는 플랫폼의 상호 운용성 없이는 불가능하다.
질병의 미시적 분석부터 치료 효과 평가까지, 데이터는 의료 발전의 초석 역할을 한다. 그러나 이러한 민감한 의료 데이터를 다룰 때 복잡한 문제가 있다. 데이터의 통찰력에는 윤리적, 법적, 개인정보 보호 요소가 포함되어 있다. 데이터 침해, 무단 액세스, 오용 가능성의 위험이 크기 때문에 엄격한 보안 조치와 규정 준수가 필요하다.
연구자, 정책 입안자, 의료 기업, 환자들 모두 미지의 바다를 항해하고 있다. 데이터 익명화는 빈틈을 메우고 완전히 보호되는 데이터 피드를 촉진하는 신뢰할 수 있는 방식으로 주목받고 있다.
의학 연구에서 데이터 익명화의 중요성
의학 연구는 과학적 이해를 발전시키는 동시에 환자의 데이터 자율성을 보존해야 하는 큰 책임이 있다. 데이터 익명화를 통해 개인 식별자를 분리할 수 있으며, 과학적 목표와 개인정보 보호 권리 사이에 필요한 균형을 제공하고, 데이터가 도출된 사람들의 신원을 공개하지 않고 정성적인 데이터 피드를 달성할 수 있다.

민감한 정보를 보호함으로써 연구자는 의료 기관, 환자 등 다른 이해관계자와 신뢰를 구축할 수 있다. 이에 따라 환자 참여가 증가하고 정확한 데이터 획득에 도움이 되며 전반적인 연구 품질이 향상된다.
더욱 엄격한 규정 준수로 인해 익명화가 개발됐다. GDPR과 함께 HIPAA(건강 보험 이동성 및 책임에 관한 법률)는 전 세계 의료 부문의 익명화를 주도하고 있다. 이러한 규정을 준수하면 법적 영향을 방지하고 연구 활동의 윤리적 기반을 강화할 수 있다.
뿐만 아니라, 데이터 익명화는 연구자들 간의 데이터 공유와 협업 문화를 조성한다. 개인정보 침해에 대한 우려를 완화함으로써 기관들은 데이터 세트를 공유할 가능성이 높아져 과학 발전을 가속화할 수 있다. 연구자들이 환자의 기밀을 유지하면서 자원을 모을 수 있으므로 협업 실행 가능성이 더욱 커지는 것이다.
의학 연구를 위한 데이터 익명화 기술
환자의 개인정보 보호 외에도 의료 서비스 제공자들이 서로 원활하게 통찰력을 교환하고 상호 운용성을 높이기 위해 데이터의 익명화가 필요하다. 이를 위해 몇 가지 중요한 기술이 있다.
① 집계 : 데이터 세트는 실제 신원을 가리면서 통계적 관련성을 보장하기 위해 환자의 연령, 질병, 지역 등과 같은 매개변수를 기반으로 그룹으로 분류되기 전에 여러 지점에서 소스로 제공된다.
② 가명화 : 이름과 같은 식별 가능한 정보를 코드로 대체한다. 데이터 과학자들은 가역적/비가역적 방법을 사용하여 재식별을 어렵게 만들 수 있다.
③ 스와핑 : 식별 가능한 정보를 교환하여 공격자에게 혼란을 야기한다. 식별 가능한 정보의 실제 값을 노출시키지 않고 데이터 세트의 전반적인 특성을 보존하는 간단한 기술이다.
④ K-익명성(K-Anonymity) : 특정 개인의 개인정보를 특정하기 어렵게 만드는 기술이다. 특정 개체의 데이터 세트가 데이터 세트에 있는 최소한 K-1개의 다른 개체와 구별되지 않도록 한다.
⑤ 데이터 마스킹 : 가장 중요한 익명화 기술인 데이터 마스킹은 기본 데이터 구조를 건드리지 않으면서 원본 데이터를 가짜 데이터로 가린다(마스크). 공격자가 개인에 대한 식별 가능한 정보를 해독하는 것을 불가능하게 만드는 것이다. 동적 마스킹을 사용하면 사용자 역할을 기반으로 데이터 세트에 액세스할 수 있으므로 중요한 정보가 승인되지 않은 사용자에게 숨겨질 수 있다.
다양한 암호화 기술을 사용해 승인된 사용자만 액세스할 수 있다. 또한 데이터 세트의 분석 값을 그대로 유지하면서 식별 가능한 정보를 노출할 수 있는 특정 필드를 제거하는 데이터 자르기 기능도 있다.
데이터 패브릭을 사용해 데이터 익명화 구현
데이터 관리와 데이터 보호는 함께 이루어진다. 의학 연구와 같이 민감한 데이터 세트의 경우 패브릭은 동기화를 달성하는 중요한 플랫폼이다. 데이터 패브릭 아키텍처는 다양한 환경에 대한 통합을 포함하여 필요한 프로세스를 간소화하며 데이터 익명화는 이를 더욱 효과적으로 만든다.
패브릭은 다양한 소스, 형식, 위치에 분산돼 있는 데이터를 통합해 보여준다. 따라서 분석, 혁신, 주요 의사결정을 위해 데이터를 효과적으로 활용할 수 있다. 데이터 익명화 도구를 데이터 패브릭 에코시스템에 통합하면 추가 보안 및 규정 준수 계층이 도입되어 데이터 유용성을 유지하면서 민감한 정보를 숨길 수 있다.
통합 프로세스에는 가명화, 일반화, 노이즈 추가와 같은 적절한 데이터 익명화 기술을 식별하고 선택하여 데이터 패브릭 워크플로에 원활하게 통합하는 작업이 포함된다.
의료 연구에서 데이터 익명화가 어떻게 사용될 수 있는지에 대한 몇 가지 예는 다음과 같다.
한 제약 회사는 암 치료 신약에 대한 임상시험에서 환자의 개인정보를 보호하기 위해 데이터 마스킹 기술을 사용한다.
병원은 임상시험 관리 중에 솔루션을 사용해 알츠하이머병에 대한 새로운 치료법에 대한 임상시험의 효율성을 높인다.
한 연구 기관에서는 비만의 원인을 연구하기 위해 데이터 공유 솔루션을 사용하여 전 세계 연구자와 데이터를 안전하게 공유한다.
결론
데이터 익명화는 방대하고 복잡한 관행이지만, 환자의 개인정보를 보호하는 동시에 연구자들이 의학 연구를 수행하는 데 필요한 데이터에 액세스할 수 있도록 해야 한다. 이를 위해 다양한 익명화 기술을 사용할 수 있으며, 최선의 접근 방식은 특정 데이터와 연구 목표에 따라 달라질 수 있다.
필자 야시 메타(Yash Mehta)는 엑스퍼사이트(Expersight) 최고 데이터 책임자(CIO)로 시장 정보, 연구 및 자문 플랫폼을 이끌고 있다. 또한 Intellectus SaaS 플랫폼의 공동 창립자이기도 하며, 신기술 시장의 기업가이자 작가이자 초기 단계 투자자다. 2015년부터 시맨틱 AI, IoT, 블록체인, 데이터 보안, 데이터 패브릭과 같은 최첨단 기술을 적극적으로 공유해 왔다.
(*이 칼럼은 GTT KOREA의 편집 방향과 다를 수 있습니다.)
관련기사
- 노코드 맞춤형 AI 챗봇 개발 플랫폼 "의료 업무 간소화"
- '데이터 유출 비용' 평균 35만 달러, 한국은 45억원 기록
- 얼굴 인식 시장, 2032년 243억 달러 전망
- [기고] 기업에 필요한 데이터 과학자
- 외과 수술과 치료를 변화시키는 AI
- [기고] 편견 없는 공정한 AI 구현 전략
- 정확성과 빠른 속도로 의료 전문가 돕는 AI
- [기고] 공격받는 의료 기관, 정부의 보안 강화 명령을 기다릴 시간 없다
- 자이메드, 의료 분야 위한 설명가능 인공지능 사례 공개
- 의료 기관 업무 효율 높이는 애플리케이션 관리 4단계
- 꿀 잠이 보약! 수면의 질 개선하는 ‘스마트고글’
- AI가 예측하는 폐암 위험 높은 비흡연자
- “초고령 사회 코 앞, 노인 돌봄 서비스에 본격 도입되는 디지털 기술”
- 만성 두통도 이젠 앱으로 관리!
- 규제 정보 관리 시장, 규제 강화 속 급성장
- 블록체인 ID 관리 시장, 매년 79.2% 기하급수적 성장
- [기고] CRM이 데이터 침해를 일으킬 수 있는 이유
- [기고] 2024년 더 스마트해지는 시맨틱 기술
- [기고] 머신러닝 엔지니어 vs. 데이터 과학자
- 의료 골든 타임 지키는 AR∙AI 기반 응급 치료 서비스
- 정확도 높은 고급 AI 의료 채팅 및 진단 플랫폼
- [2024년 전망] 비즈니스에 영향 미칠 데이터 관리 5대 트렌드
- [CES 2024] 엘레멘트, AI 기반 의료기기 인증 지원 플랫폼 공개
- 생성AI, 보험사 사기 탐지와 고객 서비스 혁신에 기여
- SaaS 활용 최적화하는 검색 엔진...운영 효율·비용관리 향상
- 올거나이즈, 글로벌 보안 보안인증 획득
- 화합물 8억 종 DB 기반 ‘AI 신약 개발 시스템’
- 디지털 헬스케어, ‘일상의 AI’ 상시 서비스로 확대 중
- [Success Story] 건국대병원, OT/IoT 보안 솔루션으로 '제로 트러스트 보안' 강화
- 소프트리에이아이, ‘AI 병원코디네이터’ 출시
- 데이터 관리∙웹 3.0 증가에 따라 ‘시맨틱 웹 솔루션’ 채택 급증
- [기고] 실시간 데이터 통합 ‘수술 역량 최적화’
- 병원과 환자를 위험에 빠뜨리는 '협력사 관리 의료 데이터'
