한국보건의료연구원, 근거와 가치 2017 Vol.3 No.1

[한국보건의료연구원]

근거기반의학의 과거, 현재 그리고 미래

Gordon H. Guyatt1, 최미영2
1 Distinguished Professor of Clinical Epidemiology and Biostatistics at McMaster University, Canada
2 한국보건의료연구원

서 론
근거의 신뢰성(credibility of evidence)을 어떻게 판단할 것인가에 대한 의문을 제기하고 근거기반 의학(evidence-based medicine, EBM)을 정의한 사람은 주지하다시피 나의 스승인 David Sackett이다. 그는 내적 근거(전문가적 지식)와 외적 근거의 활용을 통해 환자에게 최신의, 최상의 근거를 면밀하고 명료하며 사려 깊게 사용하자고 제안했다[1].

EBM의 3가지 원칙(principles)을 먼저 소개하고자 한다.

첫 번째, 근거는 위계(hierarchy)를 가진다는 것이다. David Sackett이 제시한 근거의 계층적 체계는 이해가 용이하여 약 20년간 널리 사용되어 왔다. 그는 무작위배정 임상시험을 가장 높은 근거로 채택하고 그 다음으로는 관찰연구, 기초연구(basic research), 임상적 경험(clinical experience) 순으로 분류하였으며, 이러한 근거의 구조 안에서 몇 가지 근거는 신뢰할 만하지만 다른 몇 가지 근거는 그렇지 않다고 하였다.

두 번째 원칙은 최상의 가용한 근거를 체계적으로 합성할 필요가 있다는 것이다. 임상 전문가들의 의견은 다양할 수 있고 심지어 임상현장과 반대의 결과가 나올 수도 있다. Iain Chalmers는 현재의 코크란연합(Cochrane Collaboration)의 초석을 다진 인물로, 체계적 문헌고찰 방법론 확립에 기여하였다. 이 원칙과 관련된 경험을 소개하자면, 본인이 35년 전 내과 수련과정에서 심혈관 병동(coronory care unit)에서 심근경색 환자가 방문했을 때 부정맥을 예방하기 위해 리도카인(lidocaine)을 정맥주입했었다. 당시에는 리도카인(lidocaine)을 지지하는 생리학적인 근거에 기반해서 시행하고 있었으나 이후 몇몇 무작위배정 임상시험연구들에서 리도카인(lidocaine) 주입이 부정맥 예방이라는 이득보다는 사망률이 높아지는 위해(harm)가 더 크다는 근거들이 발표되었다. 하지만 여전히 전문가들의 의견은 일치되지 않았고, 근거와 반대되는 의견이 제시되거나 의견이 없는 등 다양한 상태에서 임상현장의 변화는 없었다. 20여 년간의 논란은 1990년대 들어 사용하지 않는 것으로 전문가들이 합의하였고, 결국 이후 심각한 일은 더 이상 발생하지 않았다. 이런 변화의 원인은 바로 1990년대에 시작된 체계적 문헌고찰과 메타분석을 통한 근거의 합성 때문이었다. 연구를 통한 데이터들이 누적되었어도 메타분석이 수행되지 않았던 기간에는 전문가들의 의견이 불일치한 상태였으나, 체계적 문헌 고찰과 메타분석을 통해 근거를 합성하고 그 결과를 검토한 이후부터 전문가들은 더 이상 리도카인(lidocaine)을 권고하지 않기로 하였다.

세 번째 EBM의 원칙은 가치와 선호도를 필요로 한다는 것이다. 대체로 근거의 양은 충분하지 않으며, 근거 자체가 무엇을 실행해야 할지를 알려주지는 않기 때문에, 임상적 의사결정 시 가치와 선호도라는 맥락(context)에서 근거가 사용될 수 있다. 내가 멘토를 맡았던 Dr. P.J, Devereaux는 미국의 심장내과 의사이며 가치와 선호도를 임상적 의사결정에 활용하였다. 그는 61명의 환자, 63명의 의사에게 다음의 상황에 대해 질문을 하고 약물의 부작용에 대한 수용성 정도를 설문조사하였다[2].

‘상황: 항혈전제치료가 100명 중 12명에서 뇌졸중 발생 위험을 4명까지 낮출 수 있는 반면, 2년 내 3건의 심각한 위장관 출혈이 발생할 수 있다. 당신은 위장관 출혈의 부작용을 어느 정도까지 수용할 수 있겠는가?’

그 결과, 환자들은 뇌졸중 예방을 위해서라면 예상보다 훨씬 많은 응답자가 위장관 출혈 부작용을 감수할 수 있다고 응답한 반면, 의사들의 응답결과는 반대의 양상을 보였다(환자: 74%, 의사: 38%). 이 연구는 근거 자체는 아무것도 알려주지 않는다는 아이러니한 상황을 보여주며, 임상적 의사결정에서 환자와 의사의 가치와 선호도 차이를 어떻게 반영할 것인가에 대한 고민이 필요하다는 것을 시사한다. 임상적 의사결정에서 근거를 어떻게 효율적으로 활용할 것인가에 대해서는 Dr. Brian Haynes가 무작위배정 임상시험연구의 구조화된 서식을 제시하면서 지금 현재의 연구 보고의 표준화를 이루었다. 중요한 것은 임상적 의사결정에 활용할 정보를 얻는 것으로 임상의사들의 주요 정보원은 진료지침이다. 이를 위해 진료지침에는 최신 정보가 제공되어야 하고, 임상의사들이 활용할 수 있는 정보서비스의 개발 및 개별 연구와의 연결이 필요하다.

본 론
David Sackett이 제시한 근거의 체계는 쉽게 그리고 많이 쓰일 수 있지만, 근거가 의사결정에 활용되기 위해서는 좀 더 기존 근거 체계를 다듬을 필요가 있었고, 따라서 방법론도 진화를 거듭했다. 이를 통해 도출된 새로운 근거 체계인 The Grading of Recommendations, Assessment, Development and Evaluation (GRADE) 방법론과 관련된 2명의 학자를 소개하고자 한다. 새로운 체계를 만드는 작업과 GRADE working group 시작을 나와 함께 한 Dr. Andrew Oxman은 현재 노르웨이 의료기술평가기구에서 일하고 있다. 나의 멘티인 Dr. Hoger Shunemman은 현재 캐나다 McMaster 대학교 임상역학교실의 교수로 도구개발 및 진료지침 개발 전문가이며 현재 GRADE 그룹의 리더를 맡고 있다.

GRADE는 체계적 문헌고찰을 통해 합성된 근거를 기반으로 바람직한 의사결정을 내릴 때 판단을 돕는 시스템이고, 근거로부터 권고로 이어지는 과정을 포괄한다. 체계적 문헌고찰 저자들이 근거를 합성해서 결론을 내릴 수 있게 하며 진료지침 패널들이 권고를 내리는데 필요한 의사결정을 도와줄 수 있다. GRADE 방법론이 12년 전 British Medical Journal (BMJ)에 처음 소개된 이후[3] Cochrane Collaboration, 영국의 국립보건임상연구원(National Institute for Health and Care Excellence), 세계보건기구(World Health Organization) 등 전 세계 100개가 넘는 단체 및 기구에서 적용하고 있다. 한국에도 잘 알려진 UpToDate®도 GRADE를 조기 수용한 단체 중 하나이다.

GRADE 그룹은 새로운 근거의 체계를 제안한다(Table 1).

무작위배정 임상시험연구는 근거수준 ‘높음(high)‘에서 시작하지만 그대로 머무를 수 없다. 비뚤림 위험 평가(risk of bias)에서 무작위배정 과정이나 은폐과정 등에서 심각한 비뚤림이 의심되면 근거의 신뢰도가 낮아지게 된다. 비일관성은 물론이고 비직접성도 근거수준을 낮추는 중요한 요소이다. 관심 있는 임상질문은 90세 이상의 환자들의 약물사용 여부이지만, 확인된 무작위배정 임상시험 연구들에 90세 이상의 환자들이 포함되지 않았다면, 그 직접적인 효과를 알 수 없는데 이것이 비직접성의 대표 사례이다. 비정밀성은 작은 표본사이즈, 넓은 신뢰구간으로 인해 효과추정치를 신뢰하기 어려움을 의미한다.

반면 관찰연구는 근거수준이 ‘낮음(low)’에서 시작하지만 계속 ‘낮음(low)’에 머무르지는 않는다. 당신의 임상상황에서 무작위배정 임상시험연구를 하지 않았다고 해서 이득을 확신할 수 없는가? 진료지침에서는 무작위배정 임상시험연구가 없어도 중재가 충분히 의미가 있는 상황은 많다. 말기신부전 환자에서 투석 효과, 아나필라틱 쇼크에서의 에피네프린(epinephrine)과 같은 임상 현장의 상황에서는 매번 무작위배정 임상시험연구를 할 수도 없고 그럴 필요도 없다. 그리고 적은 표본 수의 무작위배정 임상시험 연구는 과장된 효과 크기와 같은 왜곡된 결과를 보이는 경우도 많다. 관찰연구의 경우 타당도의 문제가 없으면서 상당한 효과 크기를 보이거나, 양-반응 관계가 있거나, 교란변수가 효과의 크기를 줄인다는 증거가 있는 경우 근거수준이 상승할수 있다. 이것이 GRADE가 제안하는 새로운 근거 체계이다.

GRADE에서 근거를 합성해서 매우 효과적으로 결과를 보여주는 방식의 표를 제안했는데, 이를 근거요약표(evidence profile)라고 한다. 이 표에서는 근거의 요소별 평가결과 및 요약된 효과추정치, 근거수준도 확인할 수 있다. 결과지표별로 근거의 신뢰도를 결정하므로 어떤 결과지표에서는 근거수준이 ‘높음’, 다른 결과지표에서는 근거주순이 ‘중등도(moderate)’가 될 수도 있다.

임상의사들이 임상 현장에서 근거를 사용하게 하는 권고의 표현 방식은 두 가지로 강하게 권고하거나 약하게 권고하는 것이다(strong vs. weak). 원하는 효과들과 원하지 않는 효과들의 균형 및 효과크기가 제시되어야 한다. GRADE는 근거를 의사결정에 활용하는 4가지 주요 요인들을 제시했다. 첫 번째로는 근거의 질(근거수준), 원하는 효과와 원하지 않는 효과의 저울질, 가치와 선호도 그리고 마지막으로 비용과 관련된 요소이다. 공중보건 분야에서는 수용성과 적용성, 해당 근거를 적용하는 곳에서의 가치 등 다른 요소를 더 볼 수도 있다.

GRADE 그룹은 이를 체계화해서 근거기반 의사결정 틀(Evidence to Decision Framework)을 제시했다. 그리고 BMJ에 2편의 논문을 게재하였다[4,5]. 이는 근거를 기반으로 의사결정을 내리는 명시적인 틀을 제시하므로 진료지침 개발 패널들에게 유용하다.

다음 논의할 주제는 임상의사가 근거를 쉽게 해석하고 효과적으로 임상에서 실행할 수 있게 도와주는 도구에 대한 것이다. GRADE의 의사결정 틀 내에서도 가치와 선호도는 불확실한 성격을 가진 부분이다. 따라서 우리는 개별환자에서 가치와 선호도에 대한 정보를 수집할 필요가 있다. 진료지침과 관련해서 임상진료현장에서 도구 사용의 필요성을 보여주는 사례를 소개하고자 한다. GRADE 실무 그룹(working group) 구성원 중의 1명인 Dr. Victor Montori는 임상 현장에서 사용할 의사결정 지원 도구에 대한 연구를 Mayo Clinic에서 진행했다[6]. 당뇨가 있는 환자들의 진료에 앞서 다양한 당뇨약 전체 목록에 대한 정보가 포함된 6개 카드를 준비하여 가장 먼저 상담하고자 하는 카드를 고르게 한 결과, 많은 환자들이 체중감소카드를 가장 먼저 선택했다(35-45%). 그 다음으로는 일일복용량 그리고 비용 순으로 선택했다. 또한, 환자들은 6가지 카드 내용에 대해 전부 다 상담을 원하지도 않았고 보통은 3~4가지의 카드를 골라 상담을 진행했다고 한다. 이런 환자 선호도에 대한 정보를 알고 설명하면 효과적으로 진료할 수 있고 환자의 의사결정에도 도움이 된다. 물론 이는 미국의 결과이므로 한국에서는 다른 결과가 나올 수도 있다.

의사들이 임상현장에서 근거를 효과적으로 활용하도록 하기 위해서는 어떻게 해야 할 것인가? 논문들의 PDF 파일들과 저널, 진료지침이 임상의사들에게 쉽게 읽히고 효과적으로 이용되고 있는가? 또는 의사결정에 활용되겠는가? 실제 현실은 그렇지 않으며, 임상 현장에 쉽게 활용할 수 있는 도구가 없이는 적용이 어렵다는 것을 알고 있다. 우리는 마법(magic)을 필요로 할지도 모른다. 여기서 우리가 개발한 MAGIC이라는 어플리케이션을 소개하고자 한다(Fig 1).

MAGIC은 GRADE 그룹에서 수련한 후 노르웨이 및 독일로 돌아간 그룹 구성원들이 개발한 전자적인 플랫폼(electronic platform)이다. 여기에서 핵심질문, 주요권고, 결과표, 권고를 지지하는 개별 연구 등을 바로 볼수 있다. 정보를 스마트폰으로 받아볼 수 있고, 연동이 된다면 의무기록으로 보낼 수 있고 쉽게 적용가능하다.

여기에 추가하여 우리는 근거 생태계 시스템(evidence ecosystem)을 필요로 한다는 점을 제언한다(Fig 2). 

기초연구, 무작위배정 임상시험연구 등의 일차연구, 근거를 합성하는 체계적 문헌고찰 등의 정보들이 이상적으로 맞춤화된 정보로 공유하는 방식으로 활용할 때, 우리는 근거기반 보건의료(evidence-based healthcare, EBH)의 질을 향상시킬 수 있다.

결 론
앞에서 EBM의 3가지 원칙을 논의했다. 근거는 체계적인 구조를 가지고 있고, 체계적으로 합성되어야 하며, 의사결정 시 가치와 선호도를 고려해야 한다. 우리는 좀 더 진화된 근거 체계인 GRADE 방법론에 대해 이야기 했으며, 근거 그 자체는 우리가 실제 임상 현장에서 무엇을 해야 할지를 말해주지 않으므로, 임상 현장에서 의사결정 시 근거를 사용하기 위해서는 의사결정 틀과 의사결정 지원을 위한 임상 현장 맞춤형 도구를 적절히 활용해야 한다.

△ 자세히 보기 : NECA → 학술지

키워드

#N
저작권자 © 의료기기뉴스라인 무단전재 및 재배포 금지