이상수의 health policy insight

[Health Policy Insight 125회]

무비교 임상근거, 보험급여 의사결정 반영의
증가 추세에 있어

▲ 이 상 수
메드트로닉코리아
대외협력부상무

의료기술평가(health technology assessment, HTA)는 광범위한 의료제도에 미치는 영향과 관련하여 의료중재술(healthcare intervention)의 평가로 폭 넓게 정의된다. HTA는 보험급여 및 기술채택에 관한 의사 결정을 알리기 위해 중재술의 임상적 가치(즉, 비교 의료 편익) 및 경제적 가치(즉, 돈에 대한 가치)를 체계적으로 평가하는 것을 목적으로 한다. 새로운 중재술의 임상적 가치를 평가하기 위해 유효성, 안전성, 건강 관련 삶의 질과 같은 환자관련 결과(patient-relevant outcomes) 측면에서 현재 이용 가능한 중재술과 비교할 필요가 있다. 중재술 간 정확하고 객관적인 비교를 위해 최상의 이용 가능한 임상근거를 사용해야 한다. 비무작위 연구(nonrandomized study)와 무비교 연구(uncontrolled study)는 약한 근거로 간주된 반면, 임상근거 계층(hierarchy)에서 RCTs를 이용한 메타분석(meta-analysis)을 제외하고는 무작위 비교임상(randomized controlled trials, RCTs)은 역사적으로 표준으로 여겨져 왔다 (그림 1). 

비무작위비교임상(non-RCT)과 비교시 RCTs는 결과에 영향을 주는 교란요인(confounding factors) 발생 가능성을 최소화하여 좀 더 강건(robust)하고 덜 편향된 치료효과 추정을 산출해낸다. 이러한 이유로 HTA 기관은 일반적으로 비교 효과(comparative effectiveness) 평가시 RCTs에 높은 선호도를 갖고 있다. 그럼에도 불구하고 RCTs를 수행하는 것이 윤리성, 실현 가능성 또는 실용성에 문제가 되는 상황이 있다. 예를 들어, 평가 중인 중재술보다 덜 효과적이라고 가정된 플라시보(placebo) 혹은 중재술을 제공하는 것은 비윤리적일 수 있다(가령, 즉각적으로 생명을 위협하는 질환). 그렇지 않으면 희귀 질환으로 치료군간 통계적으로 유의한 차이를 발견하는데 충분한 환자를 모집하기 어려운 경우(가령, 희귀 유전질환) 혹은 비교할 수 있는 확립된 치료 옵션이 없는 경우도 있다(가령, 진전된 암). 이러한 경우 무비교 연구(noncomparative study)가 "최선의 이용 가능한(best available)" 근거를 제공할 수 있다. 임상시험 환경에서 무비교 연구는 투여선량연구(dose-ranging study), 단일군 연구(single-arm trials), 사례연구(case series) 및 사례보고(case report)를 포함한 다양한 디자인을 포함한다. "실세계(real world)" 설정(즉, 전형적인 임상연구 환경에서 벗어난 경우)은 레지스트리 연구(registry study), 청구데이터(claims data), 그리고 일부 관찰 설계(observational design)를 포함한다. RCTs에 비해 덜 강건하다고 여겨지지만 무비교 연구는 의료 의사결정을 할 수 있고 의사결정에 정보를 제공한다. 미성숙 임상 데이터(immature clinical data)를 기반으로 한 바이오 마커 기반(biomarker-based)의 "개인화된 의약품(personalized medicine)"과 조건부 허가(conditional regulatory approval) 시대에는 1상(phase 1) 혹은 2상(phase 2) 임상연구(예를 들어, 투여선량 혹은 단일군 임상연구)와 같은 무비교 연구를 토대로 보험급여 의사결정을 내릴 필요가 있으며 이러한 경향은 계속될 것으로 예상된다. 미국 FDA와 유럽 의약처(European Medicines Agency, EMA)는 획기적 상태(breakthrough status; FDA), 신속승인 경로(accelerated approval pathway; FDA) 및 맞춤형 경로 시범사업(adaptive pathways pilot; EMA)과 같은 유망한 의약품에 대한 조기 환자 접근을 촉진하기 위한 메커니즘을 개발하였다. 

본 연구의 평가 선택(appraisal selection)에 대하여 포함기준(inclusion criteria)은 적응증 혹은 결과에 관계없이 의약품 중재(interventions)에 대한 모든 단일기술평가(single technology appraisals)를 포함하였고 다중기술평가(multiple technology appraisals), 백신 및 의료기기 평가, 자문 요청, 그리고 보건 경제성 자료(health economic dossiers)는 제외하였다. 포함기준을 근거로 총 549건의 평가(appraisals)가 추출되었다: 영국 National Institute for Health and Care Excellence (NICE) 118건, 캐나다 Canadian Agency for Drugs and Technologies in Health (CADTH) 262건, 독일 Institute for Quality and Efficiency in Health Care(Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen, IQWiG) 169건. 전체적으로 NICE는 유리한 결과로 가장 높은 신청을 보였고(57% 권고, 27% 제한적 권고), CADTH(10% 권고, 58% 제한적 권고), 그리고 IQWiG(14% 권고, 24% 제한적 권고)가 뒤를 이었다. NICE 평가 38%(45/118건), CADTH 평가 13%(34/262건), IQWiG 평가 12%(20/169건)에서 무비교 근거(noncomparative evidence)가 고려되었다. 오직 무비교 근거에 기초한 근거 제출은 NICE 평가 4%(5/118건), CADTH 평가 6%(16/262건), IQWiG 평가 4% (6/169건)에서만 보였다 (표1).

숫자적으로 권고(recommended), 제한적 권고(restricted) 및 미권고(not recommended) 제출 비율은 모든 기관에 제출된 근거 유형에 따라 달랐다. 무비교 근거만 제시한 신청에 대한 긍정적 결과(권고, 제한적 권고 및 부가 혜택 결정(added-benefit decision) 포함)는 CADTH의 경우 전체적인 권고율과 유사하였으나(69%, 11/16건 vs. 68%, 178/262건) NICE(60%, 3/5건 vs. 84%, 99/118건)와 IQWiG(17%, 1/6건 vs. 38%, 65/169건)는 현저히 낮았다. 그럼에도 불구하고, 표본 크기는 무비교 근거만을 제시하는 신청에서 매우 작았고, 비율 차이는 어떤 기관에 대해서도 통계적 유의성을 충족시키지 못했다(P>0.05). RCTs와 함께 무비교 근거를 포함한 신청의 결과 비율은 수치적으로나 통계적으로 모든 기관의 전체 결과율과 비슷했다(표 1).
전반적으로 검토된 HTA 신청에 제시된 대다수 무비교 근거는 단일군 연구, 무작위 투여 연구(randomized dosing study), 그리고 단일군 확장 연구(single-arm extension study)로 구성되었다(그림 2). 

NICE 및 CADTH 신청의 경우, 연구의 대부분은 효능 및/혹은 안전성을 뒷받침하는데 사용되었고, 삶의 질 결과를 뒷받침하는 비율은 더 적었다. IQWiG의 경우, 대다수 무비교 연구는 평가와 관련이 없는 것으로 간주되었다(그림 2). 질병 영역과 관련하여, 무비교 근거를 제시하는 대다수 신청은 암 또는 감염(특히 C형 간염) 대상 치료였고, 이러한 치료 영역 내에서 희귀질환 대상이 상당한 비율을 차지하였다(그림 3). 

무비교 근거를 제출한 신청 비율에 의미 있는 시간 추세(time trend)는 관찰되지 않았다(그림 4). 

모든 국가에서 무비교 근거를 제시하는 신청의 절대 건수는 시간 경과에 따라 증가하는 경향을 보였지만 이는 전반적으로 평가 건수의 증가를 반영한다. 이와 유사하게 무비교 근거를 포함하거나 무비교 근거만을 제시한 신청의 권고 비율은 전반적인 권고 비율과 비교시 시간 경과에 따라 크게 변하지 않았다. 다른 기관들이 제시한 비평(critique) 측면에서 NICE와 CADTH는 편향 위험성이 더 높은 무비교 근거의 낮은 질에 비판적 이었지만 좀 더 강건한 연구의 부재 하에 이러한 근거를 고려할 준비가 되어 있었다. IQWiG는 일반적으로 무비교 연구를 고려하지 않았으며, C형 간염 바이러스 감염에 대한 ledipasvir/sofosbuvir은 2015년에 무비교 근거만으로 유리한 권고가 내려진 유일한 의약품이었고 실제로 무비교 근거가 수용 가능한 것으로 간주되는 유일한 신청이었다. 무비교근거 만으로 수용된 신청의 대부분(NICE 5/5건, CADTH 16/16건 및 IQWiG 1/6건)은 새로운 대안에 대한 임상적 필요성 혹은 미충족 니즈를 비교하기 위한 효과적인 치료 대안 부재가 기여 요인 가운데 하나였다(NICE 5/5건, CADTH 15/16건, IQWiG 1/1건). 두 번째로 가장 빈번하게 열거된 이유는 평가 대상 치료가 소규모 환자에서 승인되었다는 점이고 따라서 비교임상은 통계적으로 유의하지 않았다(NICE 2/5건, CADTH 6/16건, IQWiG, 0/1건); 셋째, 예상되는 치료 효과 크기가 충분히 커서 비교연구를 실시하는 것은 비윤리적인 경우였다(NICE 2/5건, CADTH 4/16건, IQWiG 1/1건). 네 번째 이유는 질환이 생명을 위협하고 플라시보나 덜 효과적인 비교대상과 비교하는 것이 비윤리적인 경우였다(NICE 1/5건, CADTH 2/16건, IQWiG 0/1건). 많은 신청에서 이러한 이유 가운데 하나 이상이 열거되었다. 전반적으로 소수의 HTA 신청이 무비교 근거만으로 긍정적인 권고를 얻었다: CADTH 11건(4%), NICE 3건(3%), IQWiG 1건(0.6 %). 그럼에도 불구하고 무비교 근거는 45건(38%)의 NICE 신청, 34건(13%)의 CADTH 신청, 20건(12%)의 IQWiG 신청에서 뒷받침하는 근거로 사용되었다. NICE와 CADTH는 일반적으로 무비교 근거의 낮은 질에 대해 비판적이지만 무비교 임상설계가 방법론 지침(method guidance)에 따라 수용 가능한 상황이 있음을 인식하고 있다(표2). 

IQWiG는 적절한 비교대상(comparator) 대비 직접 비교연구로부터 추가적인 치료 혜택의 입증을 강조하고 있으며 무비교 근거를 제시하는 신청에 대해 매우 비판적이었다. 이는 평가된 모든 신청에서 볼 수 있는 것보다 무비교 데이터에만 기반한 신청에 대한 권고비율이 더 낮음이 반영되고 있다. 그럼에도 불구하고 비교근거를 제시하는 평가와 무비교 근거를 제시하는 평가 간에 권고 비율이 다르더라도 표본 크기는 작았고 유의한 차이가 관찰되지 않았다. 무비교 근거를 제시하는 대다수 신청은 안전성 및 유효성을 뒷받침하는 이용된 단일군 연구였고 용량 선량 연구(dose-ranging study)와 확장 연구(extension study)도 제시되었다.
생명을 위협하는 질환(예를 들어, 치료 후기단계에서의 암), 치료군간 통계적으로 유의한 차이를 검출할 수 있는 검정력이 확보되지 않는 적은 규모의 환자군 질병에 대한 중재술(가령, 희귀 유전질환), 그리고 예비적 자료가 충분히 큰 편익을 제시하고 비교연구가 윤리적이지는 않은 질환에 대한 중재술(가령, C형 간염)의 경우, 단일군 연구는 플라시보 비교 연구가 부적절한 질환 영역의 중재술을 반영하는 경향을 보인다. 다른 예로는 높은 미충족 니즈 혹은 대안 치료의 부족으로 무비교 근거를 수용할 수 있는 말기 또는 희귀 질환을 포함한다. 따라서 무비교 근거에 근거하여 권고된 대다수 치료법은 종양학, 희귀질환 적응증 또는 치료 잠재성(특히 C형 간염 감염) 분야였다. HTA 의사결정에서 무비교 근거의 역할과 관련하여 주목할만한 시간추세(time trend)는 관찰되지 않았다. 그럼에도 불구하고 목표의학(targeted medicine)의 시대와 조건부 승인이 점점 더 보편화되고 있는 상황에서 무비교 근거가 HTA에서 더 큰 역할을 할 것으로 보인다. 보험자는 혁신 신약에 대한 환자 접근성을 허용하고 이미 이러한 사항을 고려하고 있다면 이에 적응할 필요가 있다. 예를 들어, IQWiG는 편익 평가(benefit assessment)와 관련하여 무비교 연구는 거의 고려하지 않았지만, 2015 년 IQWiG-Herbst 심포지엄(헬스케어의 현행 및 논쟁적인 주제를 다루는 연례회의)은 편익평가에서 무비교 데이터를 포함한 실세계 데이터(real-world data) 역할에 중점을 두었다. 무비교 근거 (sofosbuvir/ledipasvir) 만으로 2015 년에 IQWiG가 처음으로 긍정적인 권고를 한 것은 시사하는 바가 큰 이정표이다. 
그럼에도 불구하고 도전과제는 여전히 남아 있으며 HTA 기관은 무비교 근거에 비판적이다. 이러한 근거의 이용은 치료 효과를 추정하는데 불확실성 요소를 가져온다; 강건한 근거 없이 혁신적 의약품에 대한 접근을 허용하면 환자를 비효과적이거나 심지어 유해한 의약품에 노출시킬 수 있다. 예를 들어, 종양학 의약품의 절반 미만이 3 상 임상에서 성공적이지만, 2 상 또는 1 상 단일군 데이터를 기준으로 많은 의약품이 허가를 받았다. 또한, 많은 의약품들이 추후 추적관찰 데이터가 이용 가능하다는 조건 하에 가속화 허가(accelerated market authorization)를 받았지만, 제약회사는 요건을 충족시키지 못함에도 불구하고 계속해서 환자들에게 의약품이 제공될 수 있다.
임상 진료에 대한 불확실한 일반화(uncertain generalizability)와 같은 RCTs와 관련한 한계에도 불구하고, RCTs는 치료 효과를 정량화하는데 가장 객관적인 도구로 남아 있다. 따라서 RCTs가 표준(gold standard)으로서 당분간 무비교 연구 설계로 대체 될 가능성은 낮다. 대신, 무비교 근거의 역할을 더 잘 정의할 기회가 있다: RCTs 설계가 실용적이지 않고 실현 가능성이 없고 혹은 윤리적이지 않고, 실세계 및 장기간 평가의 맥락에서 RCTs 데이터를 강화하고 타당성을 검증하는데 유용한 경우, 수용 가능하다.
그럼에도 불구하고 의사결정 과정에서 중요한 역할을 하는 무비교 연구는 평가 요약 문서(appraisal summary document)에 기술되어 왔다. 본 연구는 임상적 가치 제안을 뒷받침하는 무비교 근거의 역할에 초점을 맞추었지만, 이러한 근거는 경제적 가치 제안을 뒷받침함에 있어서도 역할을 할 수 있다(가령, 단일군 확장 데이터를 사용하여 장기간 비용효과성 모델 생존 예측의 타당성 평가).
위에서 언급 한 범주에서 무비교 근거는 연구설계가 정당하고 해당국가의 참고 사례를 충족하고 치료 혜택이 설득력 있게 입증될 수 있다면 HTA 기관에 의해 수용 가능한 임상 근거로 채택될 수 있다. 향후 개인화된 의약품(personalized medicine) 및 조건부 허가(conditional regulatory approval) 증가 추세는 HTA 의사 결정에서 무비교 근거의 더 큰 역할을 필요로 한다.

시사점

HTA 기관의 의사결정에서 무비교 근거(noncomparative evidence) 역할은 현재 작지만 다음과 같은 상황에서 수용 가능함:

• 치료에 대한 높은 미충족 니즈 혹은 비교할만한 확립된 대체 치료 옵션이 없는 경우(가령, 희귀 유전 질환 및 드문 암)
• 희귀질환 및 치료군 간 통계적으로 유의한 차이를 검출할 수 있는 충분한 검정력으로 임상연구를 설계하기 어려운 경우(가령, 희귀 적응증)
• 예비 임상 데이터를 통해 치료 대안에 대한 직접적 비교연구가 비윤리적인 것으로  간주될 정도로 충분히 큰 임상 효과를 제시하는 경우(가령, C형 간염)
• 중증질환이고 생명을 위협하나 효과적인 대체 치료법이 없으며 환자를 플라시보나 연구자의 선택된 대조군에 무작위로 할당하는 것이 비윤리적인 경우(가령, 진전된 암)

자료출처 : The Role of Noncomparative Evidence in Health Technology Assessment Decisions

Griffiths EA, Macaulay R, Vadlamudi NK, Uddin J, Samuels ER. Value in Health 2017;20(10):1245-1251
https://www.ispor.org/comparative-effectivness-research_HTA_decisions.pdf

* 본 컬럼은 의료기기를 비롯한 헬스케어 분야의 국내외 학회지에 발표된 논문 및 연구보고서 등을 살펴봄으로써 우리나라 의료기기 관련 보건의료정책 마련에 통찰력을 제공하기 위한 목적으로 매주 발표됨

키워드

#N
저작권자 © 의료기기뉴스라인 무단전재 및 재배포 금지