나이·성별·흡연·음주·아스피린 등 위험요인 5개 특정 기존 모델 대비 신뢰도 높고 간편한 것이 장점
이풍렬 교수 “효과적인 대장암 예방에 보탬 기대”
대장암의 원인이 되는 진행성 선종 발생 위험을 확인할 수 있는 한국형 자가진단 예측모델이 개발됐다.
현재 사용 중인 예측모델에 비해 간편하고 신뢰도 역시 높은 것으로 나타나 의료진뿐만 아니라 일반 국민들도 대장 선종 위험을 조기에 발견하고 관리하는 데 도움될 것으로 기대된다.
삼성서울병원 소화기내과 이풍렬·손희정·홍성노 교수 연구팀은 지난 2003년부터 2012년 사이 병원에서 대장내시경 검사를 받은 환자 약 5만명을 빅데이터 분석을 통해 대장선종 예측모델을 개발했다.
소화기질환 분야에서 빅데이터 기술을 활용해 질병 예측모델을 개발한 것은 이번이 처음이다.
연구팀은 우선 연구기간 동안 병원을 찾은 환자 4만 9,450명의 의무기록을 정량화하는 작업부터 진행했다.
환자의 나이, 성별, 각종 검사수치와 같이 정형화된 자료는 물론 영상검사 판독결과처럼 의사마다 다를 수 있는 서술형 진료기록도 표현방식과 관계없이 의미가 같은 것을 추출, 숫자로 변환하여 빅데이터 분석자료로 활용했다.
이를 토대로 연구팀은 선종이 발견된 환자와 그렇지 않은 환자를 각각 분석해 나이, 성별, 흡연력, 음주빈도, 아스피린 복용 여부 등 위험인자 5가지를 특정하여 지수화하는 데 성공했다.
기존 모델 대비 새로 만든 모델의 유효성을 평가한 결과 적중률(AUC, Area Under the Curve)은 71.6%였다. 기존에 쓰던 아시아-태평양 예측모델 적중률 67.8%에 비해 신뢰도를 한층 더 높였다.
예측모델= -8.39 + 0.0154*흡연기간(년) + 0.1003*음주빈도(음주X=0 / 주1회=1 / 월 2~3회=2 / 주 1~2회=3 / 주 3~4회=4 / 주 5~6회=5 / 매일=6) – 0.5772*아스피린 복용(정기 복용=1 / 미복용=0) + 0.4098*성별(남=1 / 여=0) + 0.0736*나이(년)
연구팀이 만든 예측모델은 위험인자에 따라 값이 달라지도록 설계됐다. 각자 서로 다른 위험인자 결과에 해당하는 값을 토대로 계산한 최종값이 -4.195 보다 낮으면 저위험군, 높으면 고위험군으로 분류된다.
이번 연구에서도 고위험군은 저위험군 환자에 비하여 선종이 있을 위험이 3.8배 더 높은 것으로 나타났다.
예측모델에서 고위험군에 속하면 조기에 대장내시경 검사를 받는 등 적극적인 위험 관리가 필요한 이유다.
이풍렬 교수는 “비정형화된 의료기록을 수치화하여 빅데이터 분석을 통해 위험예측 모델을 만들었다는 데 의의가 있다”면서 “대장암으로 이어질 수 있는 대장선종이 있을 위험이 어느 정도인지 가늠하고 효과적으로 예방하는 데 보탬이 되길 기대한다”고 전했다.
한편, 이번 연구는 미국 공공과학도서관이 발행하는 국제학술지인 플로스원(PLoSONE)에 게재됐다.