점점 더 많은 조직들이 고급 예측과 처방 분석으로의 전환하고 있다. 현재 전통적인 데이터 과학자들은 비용이 많이 들고 구하기가 어렵다. 시민 데이터 과학자는 데이터 과학자의 부족 문제를 해결하는 매우 효과적인 방법이 될 수 있다. 기술의 발전은 시민 데이터 과학자의 부상을 뒷받침한다. 기술 덕분에 비전문가도 동일한 목표를 더 쉽게 달성할 수 있다.

시민 데이터 과학자의 직무에는 새로운 데이터를 처리하는 것, 빅데이터를 처리하기 위해 자동화된 도구를 사용하는 것, 추가적인 통찰력을 얻기 위한 추가 모델을 생성하는 것 등이 포함된다. 이들의 주요 임무는 빅데이터에서 직접 예측하거나 규범적 분석을 개발하는 것이 아니라, 이러한 목표를 달성하는 모델을 구축하고 도구를 사용하는 것이다.

시민 데이터 과학자들은, 교육을 받고 학위를 취득한 ‘진정한’ 데이터 과학자와 자체 셀프 서비스 분석을 수행하는 비즈니스 소유자 간의 격차를 메워준다. 비유하자면, 데이터 과학자는 한 시간에 10마일을 달릴 수 있지만, 시민 데이터 과학자는 더 적은 비용으로 한 시간 내에 퍼팅을 하고 차를 예열하고 10마일을 운전할 수 있다. 물론 시민 데이터 과학자는 도중에 많은 풍경을 볼 수는 없겠지만 어쨌든 작업을 완료할 수 있다.

시민 데이터 과학자는 현재로서는 사내 프로모션을 통해서만 접근할 수 있다. 시민 데이터 과학자는 데이터 과학자의 부족을 해결하기 위한 방안으로 몇 년 동안 존재했다. 일반적으로 데이터 과학자가 수행하는 작업의 대부분은 데이터 품질 검증, 데이터 세트 병합, 데이터 소스 식별과 같은 일상적인 운영 작업이다. 이러한 작업은 지루하고 시간이 많이 걸리는데 ‘비싼’ 데이터 과학자가 이를 수행하는 것은 그다지 비용 효율적이지 않다. 자동화를 통해 이러한 작업을 수행하려면 훨씬 저렴한 인력을 고용하는 것이 좋다.

시민 데이터 과학자 입장

경영진은 단기 프로젝트를 위해 데이터 과학자를 고용하고 인터넷 영업부서를 개편하고, 비용을 절감하고 경험을 유지하기 위한 방법으로 데이터 과학자를 파트타임으로 보조할 영구 ‘팀원’을 배정한다. 프로젝트가 끝나면 팀원은 새로 설치된 분석 프로그램과 인터넷 판매를 위한 예측 알고리듬을 매일 유지 관리하게 된다. 또한 팀원은 새로운 책임에 대한 기본 지식을 얻기 위해 4개의 수업을 수강해야 한다. 똑똑하고 자기 주장이 강한 팀원은 시민 데이터 과학자로 승진하겠다는 생각으로 경영진에 접근할 수도 있다.

이와 같은 상황에서 조직 내에는 많은 변화가 일어나고 있으며, 경영진이 직원 전체와 철저하게 소통하지 않으면 혼란이 일어날 수 있다. 이상적인 것은 팀원이 일부 책임을 다른 직원에게 위임하는 것이다. 또한 ‘선택받은 자’는 주중에 공부하거나 온라인 수업에 참석할 시간을 가져야 한다. 그리고 새로 교육을 받은 팀원이 교육 및 승진 후 6개월 동안 새 직장을 떠나지 않도록 조치를 취해야 한다. 두 명 이상의 시민 데이터 과학자를 직원으로 두는 것이 더 유리하다.

시민 데이터 과학자 ‘만들기’

적합한 사람을 선택하는 것이 중요하다. 독서를 즐기는 사람들은 독서가 지루하다고 생각하는 사람들에 비해 상당한 이점을 갖는다. 새로운 기술을 배우는 것을 좋아하지 않는 사람들이 있는 반면, 다른 사람들은 학습 과정을 계속하고 더 유연한 사고방식을 유지하기 위해 스스로 수업을 받을 수도 있다.

시민 데이터 과학자 역할을 만들 때 올바른 교육과 도구를 제공하는 것이 특히 중요하다. 조직을 변화시키고 수업 비용 등을 지불하기로 결정한 후 제대로 작동하지 않는 교육과 도구로 프로세스를 중단하는 것은 어리석은 일이다. 효율적인 시민 데이터 과학자와 오늘날의 비즈니스 인텔리전스 및 분석 도구를 결합하면 기업이 데이터 전략을 크게 가속화하고 수익을 향상시키는 데 도움이 될 수 있다.

시민 데이터 과학자 ‘되기’

데이터 과학에 진정한 관심이 있지만 고급 학위를 취득하기 위해 학교에 갈 수 없는 사람에게는 시민 데이터 과학자가 이상적일 수 있으며, 자격증 프로그램이 유용한 교육을 제공할 수 있다. 자율 학습 과정부터 사내 교육, 지역 커뮤니티 대학 야간 수업까지 다양한 경로를 선택할 수 있다. 이는 현재 기술, 조직의 요구 사항과 자신에게 가장 적합한 학습 접근 방식에 따라 달라진다.

다양한 학습 스타일과 기법이 있으며, 다양한 사람들이 특정 스타일 조합을 통해 더 빠르고 쉽게 학습할 수 있다. 가장 기본적인 학습 스타일은 이미지, 공간 이해 및 그림을 사용하는 시각적 학습과 듣기와 토론을 통한 언어 학습, 촉각을 사용하는 신체 학습 등이 있다. 또한 혼자 공부하는 것을 선호하는 사람도 있고, 그룹과 함께 공부하는 것을 선호하는 사람도 있다.

시민 데이터 과학 연구

많은 곳에서 시민 데이터 과학자에게 필요한 기본 기술을 제공하는 온라인 강좌를 시행하고 있다. 고용주가 조직의 필요에 따라 몇 가지 수업을 추가할 가능성이 매우 높지만 시민 데이터 과학 과정을 수강하는 것은 좋은 기초가 된다.

교육에는 SQL을 사용한 데이터 준비, 분류 모델의 기본 개념 이해, 고객 대시보드 구축, SQL을 사용한 분할 모델 생성, 머신러닝으로 타깃팅 모델 구축, 머신러닝을 활용한 추천 시스템 구축 등이 포함돼야 한다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지