통계적 분석과 기계학습적 분석 기술을 활용한 폐암 환자의 장기 생존에 영향을 미치는 위험 요인들과 연관성에 관한 연구

Other Titles
A Study on Predictors and Its Association Related to Long-term Survival in Lung Cancer Patients Using Statistical and Machine Learning Analysis Technologies
Authors
김대준
Issue Date
2014-12
Awarded Date
2015
Abstract
본 연구는 폐암 환자의 장기 생존에 영향을 미치는 인자를 선별하기 위한 의사결정나무 분석의 타당성 및 유용성을 알아보고자, 2001년 1월부터 2010년 2월까지 I-IIIA기 비소세포폐암으로 근치적 절제술을 받은 1,289명의 환자를 대상으로 분석을 하였다. 통계적인 전처리 과정을 거쳐 폐암 환자의 장기 생존과 관련된 독립적인 위험 요인들을 Wald forward logistic regression을 통해 선별하였고, 이들 요인들 간에 연관성은 분류-회귀모형 (CART)을 이용하여 분석하였다. 전처리 과정을 통하여 26개의 독립적인 위험 요인들이 선별되었으며, Cox 비례 위험 모형을 이용한 다변량 분석에서는 연령, 당뇨병, 고혈압, 만성 신부전, FEV1%, 수술 방법(개흉술 또는 흉강경 수술), 수술 후 호흡기계 합병증, 종양의 크기, 림프-혈관 침윤 유무, 수술 후 보조 요법 필요 여부 등이 중요한 예후 인자였다. 동일한 26개의 위험 요인들을 투입하여 CART 모형으로부터 8개의 연관 규칙 (association rules or rules)을 획득할 수 있었다. 분석 결과, 이들 규칙 가운데에 폐암 환자의 장기 생존과 관련된 규칙으로는 1) open surgery, stage I, functional class 1-2, FEV1 < 88.8%, 2) open surgery, stage II-IIIA, functional class 0, multi-station nodal involvement, 3) open surgery, stage II-IIIA, functional class 1-3, FEV1 < 116.5%로 조사되었으며, 정확도 73.5%, 민감도 59.9%, 특이도 81.2%, AUC 70.5%의 통계적인 분별력을 보여주었다. 통계적 분석을 바탕으로 시행한 기계학습적 분석으로 TNM 병기 외에 폐암 환자의 장기 생존에 영향을 미치는 요인들을 선별할 수 있었으며, 임상종양학에서 데이터 마이닝 기법을 활용하면 이미 알려진 지식 외에 더 많은 정보를 제공할 수 있으리라 생각한다.
The aim of this study is to test the feasibility of decision tree analysis on prediction of long-term, overall survival in stage I-IIIA non-small cell lung cancer patients. A total of 1,289 patients who underwent a curative surgery between 2001.01 and 2010.02 were enrolled. In univariate analysis, 26 variables were risk factors, and a multivariate Cox proportional hazard model revealed that age, diabetes mellitus, hypertension, chronic renal diseases, FEV1%, mode of surgery(open vs VATS), postoperative pulmonary complication, tumor size, lymphovascular invasion, adjuvant treatment were prognostic factors. Decision tree analysis was conducted using CART algorithm after pre-processing. It revealed 8 prognostic rulesets of which accuracy, sensitivity, specificity, and AUC were 73.5%, 59.9%, 81.7%, and 70.5%. The rulesets revealed that 1) open surgery, stage I, functional class 1-2, FEV1 <88.8%, 2) open surgery, stage II-IIIA, functional class 0, multi-station nodal involvement, 3) open surgery, stage II-IIIA, functional class 1-3, FEV1 <116.5% were the risk factors. Decision tree analysis can be applied to predict long-term survival in lung cancer patients, and this suggests that data mining tools have a potential to give new insights in the management of cancer patients.
URI
http://kumel.medlib.dsmc.or.kr/handle/2015.oak/11387
Appears in Collections:
3. Thesis (학위논문) > 1. School of Medicine (의과대학) > 박사
Full Text
http://dcollection.kmu.ac.kr//jsp/common/DcLoOrgPer.jsp?sItemId=000000051000
File in this Item
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE