야시 메타 / 엑스퍼사이트 최고 데이터 책임자
야시 메타 / 엑스퍼사이트 최고 데이터 책임자

의학 연구는 역동적이고 방대하기 때문에 기관들은 너무 많은 데이터 관리 솔루션을 실험하는 것에 대해 우려해 왔다. 노출 위험, 궁극적으로 환자 데이터 기밀 침해로 인해 큰 피해를 입을 수 있기 때문이다. 동시에 데이터가 의료의 미래를 형성하는 데 없어서는 안 될 역할을 한다는 사실은 부인할 수 없다.

고품질의 시기적절한 치료를 시행하려면 주문형 데이터에 대한 통찰력이 필요하며 이는 플랫폼의 상호 운용성 없이는 불가능하다.

질병의 미시적 분석부터 치료 효과 평가까지, 데이터는 의료 발전의 초석 역할을 한다. 그러나 이러한 민감한 의료 데이터를 다룰 때 복잡한 문제가 있다. 데이터의 통찰력에는 윤리적, 법적, 개인정보 보호 요소가 포함되어 있다. 데이터 침해, 무단 액세스, 오용 가능성의 위험이 크기 때문에 엄격한 보안 조치와 규정 준수가 필요하다.

연구자, 정책 입안자, 의료 기업, 환자들 모두 미지의 바다를 항해하고 있다. 데이터 익명화는 빈틈을 메우고 완전히 보호되는 데이터 피드를 촉진하는 신뢰할 수 있는 방식으로 주목받고 있다.

의학 연구에서 데이터 익명화의 중요성

의학 연구는 과학적 이해를 발전시키는 동시에 환자의 데이터 자율성을 보존해야 하는 큰 책임이 있다. 데이터 익명화를 통해 개인 식별자를 분리할 수 있으며, 과학적 목표와 개인정보 보호 권리 사이에 필요한 균형을 제공하고, 데이터가 도출된 사람들의 신원을 공개하지 않고 정성적인 데이터 피드를 달성할 수 있다.

민감한 정보를 보호함으로써 연구자는 의료 기관, 환자 등 다른 이해관계자와 신뢰를 구축할 수 있다. 이에 따라 환자 참여가 증가하고 정확한 데이터 획득에 도움이 되며 전반적인 연구 품질이 향상된다.

더욱 엄격한 규정 준수로 인해 익명화가 개발됐다. GDPR과 함께 HIPAA(건강 보험 이동성 및 책임에 관한 법률)는 전 세계 의료 부문의 익명화를 주도하고 있다. 이러한 규정을 준수하면 법적 영향을 방지하고 연구 활동의 윤리적 기반을 강화할 수 있다.

뿐만 아니라, 데이터 익명화는 연구자들 간의 데이터 공유와 협업 문화를 조성한다. 개인정보 침해에 대한 우려를 완화함으로써 기관들은 데이터 세트를 공유할 가능성이 높아져 과학 발전을 가속화할 수 있다. 연구자들이 환자의 기밀을 유지하면서 자원을 모을 수 있으므로 협업 실행 가능성이 더욱 커지는 것이다.

의학 연구를 위한 데이터 익명화 기술

환자의 개인정보 보호 외에도 의료 서비스 제공자들이 서로 원활하게 통찰력을 교환하고 상호 운용성을 높이기 위해 데이터의 익명화가 필요하다. 이를 위해 몇 가지 중요한 기술이 있다.

① 집계 : 데이터 세트는 실제 신원을 가리면서 통계적 관련성을 보장하기 위해 환자의 연령, 질병, 지역 등과 같은 매개변수를 기반으로 그룹으로 분류되기 전에 여러 지점에서 소스로 제공된다.

가명화 : 이름과 같은 식별 가능한 정보를 코드로 대체한다. 데이터 과학자들은 가역적/비가역적 방법을 사용하여 재식별을 어렵게 만들 수 있다.

스와핑 : 식별 가능한 정보를 교환하여 공격자에게 혼란을 야기한다. 식별 가능한 정보의 실제 값을 노출시키지 않고 데이터 세트의 전반적인 특성을 보존하는 간단한 기술이다.

K-익명성(K-Anonymity) : 특정 개인의 개인정보를 특정하기 어렵게 만드는 기술이다. 특정 개체의 데이터 세트가 데이터 세트에 있는 최소한 K-1개의 다른 개체와 구별되지 않도록 한다.

데이터 마스킹 : 가장 중요한 익명화 기술인 데이터 마스킹은 기본 데이터 구조를 건드리지 않으면서 원본 데이터를 가짜 데이터로 가린다(마스크). 공격자가 개인에 대한 식별 가능한 정보를 해독하는 것을 불가능하게 만드는 것이다. 동적 마스킹을 사용하면 사용자 역할을 기반으로 데이터 세트에 액세스할 수 있으므로 중요한 정보가 승인되지 않은 사용자에게 숨겨질 수 있다.

다양한 암호화 기술을 사용해 승인된 사용자만 액세스할 수 있다. 또한 데이터 세트의 분석 값을 그대로 유지하면서 식별 가능한 정보를 노출할 수 있는 특정 필드를 제거하는 데이터 자르기 기능도 있다.

데이터 패브릭을 사용해 데이터 익명화 구현

데이터 관리와 데이터 보호는 함께 이루어진다. 의학 연구와 같이 민감한 데이터 세트의 경우 패브릭은 동기화를 달성하는 중요한 플랫폼이다. 데이터 패브릭 아키텍처는 다양한 환경에 대한 통합을 포함하여 필요한 프로세스를 간소화하며 데이터 익명화는 이를 더욱 효과적으로 만든다.

패브릭은 다양한 소스, 형식, 위치에 분산돼 있는 데이터를 통합해 보여준다. 따라서 분석, 혁신, 주요 의사결정을 위해 데이터를 효과적으로 활용할 수 있다. 데이터 익명화 도구를 데이터 패브릭 에코시스템에 통합하면 추가 보안 및 규정 준수 계층이 도입되어 데이터 유용성을 유지하면서 민감한 정보를 숨길 수 있다.

통합 프로세스에는 가명화, 일반화, 노이즈 추가와 같은 적절한 데이터 익명화 기술을 식별하고 선택하여 데이터 패브릭 워크플로에 원활하게 통합하는 작업이 포함된다.

의료 연구에서 데이터 익명화가 어떻게 사용될 수 있는지에 대한 몇 가지 예는 다음과 같다.

한 제약 회사는 암 치료 신약에 대한 임상시험에서 환자의 개인정보를 보호하기 위해 데이터 마스킹 기술을 사용한다.

병원은 임상시험 관리 중에 솔루션을 사용해 알츠하이머병에 대한 새로운 치료법에 대한 임상시험의 효율성을 높인다.

한 연구 기관에서는 비만의 원인을 연구하기 위해 데이터 공유 솔루션을 사용하여 전 세계 연구자와 데이터를 안전하게 공유한다.

결론

데이터 익명화는 방대하고 복잡한 관행이지만, 환자의 개인정보를 보호하는 동시에 연구자들이 의학 연구를 수행하는 데 필요한 데이터에 액세스할 수 있도록 해야 한다. 이를 위해 다양한 익명화 기술을 사용할 수 있으며, 최선의 접근 방식은 특정 데이터와 연구 목표에 따라 달라질 수 있다.

 

필자 야시 메타(Yash Mehta)는 엑스퍼사이트(Expersight) 최고 데이터 책임자(CIO)로 시장 정보, 연구 및 자문 플랫폼을 이끌고 있다. 또한 Intellectus SaaS 플랫폼의 공동 창립자이기도 하며, 신기술 시장의 기업가이자 작가이자 초기 단계 투자자다. 2015년부터 시맨틱 AI, IoT, 블록체인, 데이터 보안, 데이터 패브릭과 같은 최첨단 기술을 적극적으로 공유해 왔다.

(*이 칼럼은 GTT KOREA의 편집 방향과 다를 수 있습니다.)

 

[알림] GTT KOREA의 동영상 마케팅 플랫폼 GTT SHOW는 오는 12월 14일 목요일 오후 2시부터 오후 3시까지 “기업의 데이터 중심 성과향상과 의사결정 효율 높이는 '전사 기업성과관리' 전략”을 주제로 무료 온라인 세미나를 진행한다. 기업의 다양한 성과 지표의 측정과 분석, 경영계획, 이동계획, 차이 및 변수 별 분석 등 경영 의사결정을 돕고 경쟁력을 강화하는 기업성과관리(CPM) 솔루션 및 ERP와 함께 운용했을 때의 장점과 실제 도입 사례를 통해 전사 CPM과 경영계획 프로세스를 개선하는 전략과 활용법이 소개된다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지