성향점수 매칭 방법을 이용한 연관성 분석 연구

Other Titles
A Study on Association Rule Mining Using Propensity Score Matching Method
Authors
정선주
Issue Date
2013-06
Awarded Date
2013
Abstract
임상 의료분야에서는 비교연구가 많이 수행되는데, 무작위 과정을 거치지 않는 비교연구의 한 분야인 관찰연구의 경우 ‘선택편의’라는 본질적 문제가 존재하게 된다. 이러한 선택편의의 문제는 관찰연구에서 두 집단을 비교할 때 이미 일반적 특성에서 차이가 나는 집단일 경우에 나타나며, 이와 같은 이유로 두 집단을 동질하게 만들기 위해 성향점수 매칭(propensity score matching) 방법이 사용되고 있다. 따라서 본 연구에서는 대용량의 임상 데이터에서 선택 편이 문제를 최소화하고 유용한 지식 생성을 도출하기 위하여 성향점수 매칭 방법을 사용하여 두 집단을 동질하게 만든 후 심방세동 환자에서 뇌경색증의 위험인자를 재평가 하고 연관성 분석을 실시한다. 본 논문에서는 성향점수 매칭 방법을 이용하여 심방세동 환자에서 뇌경색증의 위험인자들을 재평가 하고자 1983년 9월에서 2010년 9월 사이에 심장내과를 방문한 환자들 중에서 심방세동으로 진단된 환자 1,134명을 대상으로 하였다. 기존 연구에서 밝혀진 심방세동 환자에서 뇌경색증 위험인자인 나이, 고혈압, 초기 심전도 리듬, 초기 심초음파의 LAD를 통제한 후 로지스틱 회귀 분석을 통해 성향점수 값을 추정하고 Rosenbaum과 Rubin이 제시한 최근접 거리 매칭 알고리즘 이용하여 매칭 하였다. 분석결과, 환자군 221명과 대조군 221명이 선별되었고, 단변량 통계분석으로 나이, 고혈압, 초기 심초음파의 LAD 수치가 뇌경색증과 관련된 독립적인 위험인자인 것으로 조사되었다. 이들 인자들 사이의 연관성을 Apriori 알고리즘으로 분석하여 7개의 연관 지식을 발견할 수 있었고, 연관성 지식의 통계적 유의성 평가 결과 7개의 규칙 중에 5개의 규칙이 유용한 규칙인 것으로 조사되었다. 본 연구에서는 위험인자들 간의 연관성을 추출할 수 있는 방법을 논의함으로써, 심방세동 환자에서 뇌경색증의 합병증 발생의 경향을 분석하는데 도움을 줄 수 있을 것으로 사료된다. 나아가 전자의무기록(electronic medical record)시스템에서 축적된 대용량의 임상 데이터를 활용하여 임상의사결정지원시스템 개발에 필요한 중요기술로 이용할 수 있을 것으로 판단된다.
Comparative studies are frequently conducted in the clinical and medical fields. In the case of observational studies in which the process of random assigning has not been under taken, an essential problem termed ‘selection bias’ exists. This problem appears between groups that are different in general characteristics. For this reason, propensity score (PS) matching is used to make the two groups homogeneous. The present study was conducted with 1,134 patients diagnosed with atrial fibrillation (A.Fib). After controlling age, hypertension, initial ECG Rhythm, and initial Echo LAD which are risk factors of cerebral infarction in A.Fib patients determined in previous studies, PS were estimated through logistic-regression analyses, and the estimated PS values were analyzed using the nearest available matching algorism. Through univariate statistical analyses, it was identified that age, hypertension, and initial Echo LAD were cerebral infarction related independent risk factors. Seven association rules could be found by analyzing the association between those factors. The statistical significance of the association rules was evaluated and the results indicated that five out of the seven rules were useful. The present study is considered helpful in analyzing the occurrence tendency of complication cerebral infarction in A.Fib because the present study discussed methods for extracting the association between risk factors.
URI
http://kumel.medlib.dsmc.or.kr/handle/2015.oak/11465
Appears in Collections:
3. Thesis (학위논문) > 1. School of Medicine (의과대학) > 석사
Full Text
http://dcollection.kmu.ac.kr//jsp/common/DcLoOrgPer.jsp?sItemId=000000020134
File in this Item
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE