이상수의 health policy insight

[health policy insight 제 121회]

미국 FDA 의료기기 허가용 임상연구 디자인 길라잡이

▲ 이 상 수
메드트로닉코리아
대외협력부상무

의료기기 pivotal 임상연구는 사용목적(intended use)의 안전성 및 효과성 평가를 뒷받침하는 근거를 수집하는 확정적 임상연구(definitive study)이다. 1건 이상의 pivotal 임상연구에서 도출된 근거는 일반적으로 시판전 허가(pre-market approval, PMA) 신청시 의료기기의 합리적인 안전성 및 효과성 확증과 미국 FDA의 전체적인 편익-위험(benefit-risk) 결정을 위한 주요 기초 역할을 한다. 일부 사례에서 PMA는 상이한 과학적 질문에 답하기 위해 고안된 다수의 임상연구를 포함하기도 한다.  

의료기기의 안전성 및 효과성은 타당한 과학적 근거(valid scientific evidence)에 기반하여결정됨을 규정하고 있다. 규정에 따른 타당한 과학적 근거는 다음과 같이 정의되어 있다: 타당한 과학적 근거는 잘 비교된 연구(well-controlled investigation), 부분적으로 비교된 연구(partially controlled studies), 대조군 없는 연구 및 객관적 임상연구(studies and objective trials without matched controls), 자격을 갖춘 전문가에 의해 잘 기술된 사례 역사(well-documented case histories), 시판된 의료기기의 중대한 인체 대상 경험 보고서 근거 등을 의미하며 자격을 갖춘 전문가에 의해 공정하고 책임감 있게 결론을 내리며 사용조건 하에서 의료기기의 안전성 및 효과성의 합리적인 확증이 있어야 한다. 근거는 의료기기 특성, 사용 조건, 경고 및 제한사항 여부 및 적정성, 사용 경험 정도에 따라 다르다. 단독 사례보고서(isolated case reports), 임의적 경험(random experience), 과학적 평가를 가능케 하는 충분한 세부내용이 부족한 보고서, 그리고 미입증 의견서(unsubstantiated opinion)는 안전성 및 효과성을 보여주는 타당한 과학적 근거로 고려되지 않는다. 그러나 이와 같은 정보는 의료기기의 안전성 및 효과성을 확인하는데 고려될 수 있다. 미국 FDA가 고려하는 안전성 및 효과성의 합리적 확증을 뒷받침하는 근거 형태는 다음과 같다. 

안전성

  • ‧ 실험실 동물을 이용한 연구, 인간 대상 연구, in vitro 연구를 포함한 비임상 연구

효과성

  • ‧ 원칙적으로 잘 비교된 연구(well-controlled investigation)가 요구됨
  • ‧ 잘 비교된 연구가 없는 경우, 의료기기 효과성을 평가에 충분한 근거를 갖춘 그 외 타당한 과학적 근거도 인정됨: 잘 비교된 연구 요건이 합리적으로 적용될 수 없는 의료기기의 경우 이와 같은 결정을 내릴 수 있음

개연성 있는 편익(probable benefits) 정도를 고려할 때 FDA는 다음과 같은 요인(factors)을 반영한다: 1) 편익 형태, 2) 편익의 강도, 3) 1개 이상 편익을 경험하는 환자의 개연성, 그리고 4) 효과 발현 기간. 개연성 있는 위험 혹은 위해(probable risks or harms) 정도를 고려할 때 FDA는 다음과 같은 요인을 반영한다: 1) 의료기기 사용과 관련한 위해 사건의 정도, 형태, 건수 및 발생율, 2) 위해 사건 개연성, 3) 위해 사건 기간, 그리고 4) 진단 의료기기의 경우 거짓양성(false-positive) 혹은 거짓음성(false-negative) 결과로 인한 위험. 
적절한 정보를 확증하기 위해 임상연구 디자인 및 실행 중 고려해야 하는 요인은 시판허가 신청시 편익-위험(benefit-risk) 결정을 하기 위해 임상연구에서 수집된다. 제조회사는 편익-위험 프레임워크(benefit-risk framework)에서 임상연구 프로토콜을 작성해야 한다. 
임상연구 설계시 의료기기 특유의 몇 가지 고려사항이 반영된다. 의료기기 형태가 임상연구 디자인 결정에 영향을 끼치지만 아래와 같은 고려사항은 모든 의료기기(치료, 미용 혹은 진단용 의료기기)에 적용된다. 의료기기 특유의 다음과 같은 특성 및 특징은 FDA가 의료기기를 어떻게 평가하고 임상연구 디자인에 어떻게 반영할지 영향을 끼친다:

의료기기 특유의 특성 및 특징

내용

의료기기 작동 방법(how the device works)

  • ‧ 근본적인 의료기기 기능 및 작동 기전에 관한 과학적 원리 이해는 제안된 임상연구 디자인 성과와 적정성을 평가하는데 관련이 있음
  • ‧ 이러한 정보는 임상연구를 개발하는데 신청자가 FDA 조언을 구하는 신청전 상담(Pre-Submission)에서 특히 중요함

사용자 술기 수준 및 훈련(user skill level and training)

  • ‧ 일부 의료기기는 안전하고 효과적인 방식으로 사용함에 있어 상당한 훈련과 술기를 필요로 함. 고도로 훈련된 외과전문의를 사용자로 필요로 하는 이식형 의료기기에 적용되며 특히 수술이 복잡한 경우 그러함
  • ‧ 간혹 다수 인원과 기술역량(skill set)이 적절한 의료기기 사용을 위해 필요함. 의료기기 연구 설계시 의료기기의 안전하고 효과적인 사용을 위해 필요한 술기를 고려해야 함
  • ‧ 임상 연구자와 인력의 기술 역량은 시판 허가 후 사용목적에 따라 의료기기 사용에 예상되는 인력의 술기 범위를 반영해야 함
  • ‧ 적절한 의료기기 사용시 임상연구자와 인력에게 제공되는 훈련은 의료기기 시판시 사용자에게 제공되는 훈련을 가이드(guide)해야 함. 시판된 의료기기에 훈련이 제공되지 않는 경우, 임상연구가 사용목적 조건을 반영할 수 있도록 연구 인력은 의료기기 사용 훈련이 제공되어서는 안됨

학습 곡선
(learning curve)

  • ‧ 일부 새로운 의료기기는 의료기기 사용과 관련한 학습곡선이 있음. 신기술의 임상연구는 의료기기 사용 전 숙달을 위해 시간이 소요됨. 이식형 의료기기는 일반적으로 이식술에 특이한 외과술이 관련되어 있음. 일부 의료기기의 경우, 학습곡선 결정은 시범 연구(pilot study)를 포함한 탐색 단계(exploratory stage)에서 이루어짐
  • ‧ 신청자가 시판 전 pivotal 임상연구시 의료기기 사용자 실제 훈련(hands-on training)을 제공하는 경우, 이와 같은 훈련은 시판 후에도 제공되어야 함
  • ‧ 급격한 학습곡선(steep learning curve)을 필요로 하는 의료기기는 일부 환경(가령, 재택 사용)에는 적합하지 않는데 이러한 상황에서는 안전하고 효과적이지 않음. Pivotal 임상연구에서 학습곡선이 있는 경우, 학습곡선 기간 동안 수집된 정보를 어떻게 프로토콜에 반영하고(가령, 임상연구에서 어떤 환자가 학습곡선 기간에 속하는지 명확히 정의함) 통계분석계획(Statistical Analysis Plan, SAP)에 결과 보고방법을 고려해야 함. 급격한 학습곡선시 사용자를 위한 표기사항(labeling)과 훈련 요건에 영향을 끼침

인적 요인 고려(human factors considerations)

  • ‧ 인적 요인은 의료기기 개발에 중요함. 의료기기 개발 프로세스의 어느 시점에서도 의료기기 사용 관련 인적 요인 연구는 좀 더 안전하고 효과적으로 만들기 위해 의료기기 디자인 혹은 사용지침을 변경하거나 환자 혹은 의료인이 좀 더 사용하기 쉽도록 하기 위해 필요함
  • ‧ 소프트웨어를 포함하고 있거나 사용자 인터페이스(user interface)를 제공하는 의료기기는 사용자 오류를 최소화하도록 고안되어야 함
  • ‧ 수작업에 의존하는 중재술 혹은 사용자의 일부분으로서 주관적 판단을 요구하는 의료기기는 사용자 술기를 더 많이 필요로 함. 실세계 상황에서 의료기기-사용자 인터페이스의 명확한 기술은 인적 요인 평가의 일부분이 되어야 함

임상연구 프로토콜은 몇 가지 가능한 환자선택 방법 가운데 하나를 담고 있다: 무작위 선택(random selection), 연속적 선택(consecutive selection), 체계적 선택(systematic selection), 및/혹은 편의적 선택(convenience selection). 

환자선택 방법

내용

무작위 선택
(random selection)

  • ‧ 모든 환자는 임상연구 선택에 있어 알려진 (대개 동일한) 기회를 가짐. 환자 무작위 선택은 환자 모집단의 편향 없는 추정치를 제공함. 무작위 선택은 병참적 어려움(logistical difficulty)으로 인해 종종 현실적이지 않음

연속적 선택
(consecutive selection)

  • ‧ 가령 병원에 도착한 순서대로 환자를 선택

체계적 선택
(systematic selection)

  • ‧ 가령, 포함/배제기준(inclusion/exclusion criteria)에 부합하는 환자 가운데 매 10번째 환자를 선택
  • ‧ 연구기간이 결과에 영향을 끼치는 환자 관련 다른 변수로 혼란(confounded)되지 않는 한 편향 없는 추정치를 제공. 예를 들어, 연구가 오전에만 지속된다면 오전에 병원을 방문한 환자는 병원 방문 모든 환자를 대표하는 대상 모집단의 대표성을 띠지 못함

편의적 선택
(convenience selection)

  • ‧ 연구자의 편리한 접근성으로 인해 환자가 선택되는 방법. 대상 모집단을 일반화할 수 없는 결과를 제공

비교연구 디자인(Comparative Study Designs) 
2개 이상의 치료 혹은 2개 이상의 진단시험 성과 비교를 비교연구 디자인(comparative study design)이라고 한다. 비교설계에서 몇 가지 다른 형태가 있다. 

비교연구

내용

평행군 설계
(parallel group design)

  • ‧ 개별 환자 혹은 샘플은 비교되는 치료 혹은 시험 가운데 하나로 할당됨. 환자(혹은 샘플)의 다른 군은 개별 치료(혹은 개별 진단시험)로 할당되어 환자군간 비교가 실행
  • ‧ 환자 무작위 할당이 공정한 비교를 위해 권고되며 환자군은 치료 혹은 시험 전에 기선(baseline)과 비교 가능

쌍 설계
(paired design)

  • ‧ 개별 환자 혹은 샘플은 동시에 모든 치료 혹은 시험을 받으며 동일 환자에서 비교할 수 있음. 예로서 안면분할 (split-face) 설계가 있는데 얼굴의 각 면을 서로 다른 의료기기로 치료
  • ‧ 일반적으로 평행군 설계보다 쌍 설계로 좀 더 정밀한 비교가 이루어지며 환자군간 비교는 환자간 변동성(variability)을 포함함. 쌍 설계는 치료 혹은 미용 치료에서는 흔하지 않지만 서로 다른 진단기기를 동일한 환자 혹은 샘플에 사용하는 진단 연구에서는 매우 흔함
  • ‧ 비국소 이상반응(non-local adverse event)이 두 가지 중재술의 1개 혹은 2개와 연관이 있는지 여부를 구분하기 어려운 단점 있음

교차 설계
(cross-over design)

  • ‧ 개별 환자 혹은 샘플은 미래 정해진 순서로 상이한 시점에 2개 이상의 치료(혹은 진단 시험)를 받음. 다양한 순서의 중재술이 종종 연구되며 개별 환자는 치료(혹은 진단시험)를 정해진 순서로 받음
  • ‧ 모든 치료(혹은 진단시험)를 동시에 한 명의 환자에게 할당할 수 없고 (가령, 쌍 설계가 적합하지 않은 경우) 한가지 치료(혹은 진단시험) 효과가 다음 치료에 미치지 않을 때(not carry over) 적합
  • ‧ 순서는 무작위로 하며 치료, 미용 및 진단 연구에서 가능

비교임상결과연구의 대조군(Controls in Comparative Clinical Outcome Studies) 
규정에 따라 4가지 종류의 대조군으로 구분된다. 

대조군

내용

비치료
(no treatment)

  • ‧ 객관적인 효과성 측정이 이용 가능하고 플라시보 효과는 무시할 정도인 경우, 치료군과 비치료군의 객관적인 결과를 비교

플라시보 대조군
(placebo control)

  • ‧ 의료기기 사용에서 플라시보 효과가 있을 경우, 가급적 사용 조건이 유사하도록 설계된 조건 하에 비효과적인 의료기기와 의료기기 사용 결과를 비교

활성 치료대조군
(active treatment control)

  • ‧ 효과적인 치료요법이 대조군으로 사용되는 경우, 가령, 플라시보 사용 혹은 비치료가 부적절하거나 환자 이해(interest of patient)에 반하는 경우

역사적 대조군
(historical control)

  • ‧ 높고 예상이 가능한 사망 혹은 징후, 예측 가능한 기간 혹은 중증도 증상, 이환이 예상되는 예방의 경우에 있어 치료를 받지 않았거나 이미 확립된 효과적인 요법을 받은 비교 가능한 환자 혹은 대상군에서 의료기기 사용 결과가 적절하게 기술된 질병의 자연력으로부터 역사적으로 도출되어 정량적으로 과거 경험과 비교

환자 자신이 대조군(subject serving as own control)

 

임상결과연구의 대조군 형태(types of controls for clinical outcome studies)

무비교 임상결과연구(Non-Comparative Clinical Outcome Studies) 
일부 임상결과연구 디자인은 동시(혹은 역사적) 대조군을 이용하지 않아 직접적인 비교대상(direct comparator)이 없기 때문에 잘 비교된 연구(not well-controlled study)가 아니다.

무비교 임상결과연구

내용

객관적 성능 기준을 갖는 단일군 연구(single-group study with objective performance criterion (OPC))

  • ‧ 객관적 성능기준(Objective Performance Criterion, OPC)은 임상연구 및/혹은 레지스트리의 역사적 데이터(historical data)에서 도출된 숫자로 나타난 목표값을 의미하며 FDA가 안전성 혹은 효과성 연구결과(endpoints) 검토와 비교를 위해 2분법 방식(성공/실패)으로 사용
  • ‧ 입증된 OPC는 매우 적으며 OPC는 일반적으로 의료기기 기술이 충분히 성숙되고 공개적으로 이용 가능한 정보 혹은 특정 종류의 의료기기에 대해 모든 이용 가능한 연구로부터 수집된 정보에 기초하여 개발
  • ‧ OPC는 모든 관련 문헌의 사전 메타분석 검토로부터 주의해서 만들어지며 환자 수준의 메타분석을 선호
  • ‧ 의학회 혹은 과학회 혹은 표준화 기구로부터 위임 혹은 채택된 경우 혹은 FDA 지침문건(guidance document)에 기술된 경우 OPC의 타당도(validity)가 더 큼
  • ‧ OPC는 단일 기업의 데이터 혹은 관련 과학 문헌 검토에 기초한 단일 기업에 의해 개발될 수 없을 뿐만 아니라 FDA에 의해 일방적으로도 개발되지 않음. 기술이 성숙되고 개선됨에 따라 OPC는 시간 경과에 의해 폐기될 수 있음. Pivotal 임상연구를 위해 OPC를 이용하고자 하는 제조회사는 연구 시작 전에 FDA 담당자와 사전에 상담 및 동의해야 함

성과목표를 갖는 단일군 연구(single-group study with performance goals (PG))

  • ‧ 성과목표(performance goal, PG)는 OPC보다는 열등한 근거 수준을 제공하며 안전성 및/혹은 효과성 연구결과(endpoint)에 대한 비교로서 FDA가 사용에 있어 충분하다고 고려된 숫자로 나타난 값(점추정치, point estimate)을 의미하며 일부 사례에서는 효과성 및/혹은 안전성 연구결과의 상한(혹은 하한) 신뢰한계(confidence limit)에 기초함
  • ‧ 의료기기 기술은 OPC 만큼 PG 사용이 잘 구축되어 있거나 성숙하지 않으며 PG를 생성하기 위해 사용된 데이터는 OPC 개발을 위해 사용된 것 만큼 강건(robust)하지 않음. PG는 도전적인 환자군이나 대조군에 대한 임상적 균형(clinical equipoise)이 없을 때 고려됨
  • ‧ PG의 타당도는 의학회 혹은 과학회 혹은 표준화 기구로부터 수용 혹은 개발된 경우 혹은 FDA 지침문건(guidance document)에 기술된 경우 더 크며 특정 신청을 위해 FDA가 일방적으로 개발하거나 제조회사가 만든 PG는 일반적으로 권고되지 않음
  • ‧ OPC와 마찬가지로 PG는 기술이 향상되고 의료기기 성능에 대한 추가 지식이 습득된 경우 시간 경과에 따라 폐기될 수 있으며 Pivotal 임상연구에서 PG를 사용하고자 하는 제조회사는 연구 시작 전에 FDA 담당자와 논의 및 동의를 구해야 함
  • ‧ PG는 주의해서 사용되어야 하며 특히, 중요한 질문 사항으로는 안전성 (혹은 효과성)에 대한 성능 목표를 달성하는 의료기기가 잘 비교된 임상연구에서 성공적으로 안전성(혹은 효과성)을 실제적으로 입증하는지 여부를 보여주는 믿을 만한 근거가 있는지 여부임
  • ‧ PG 달성(혹은 달성 실패)이 필연적으로 연구결과의 즉각적인 수용(혹은 거절)을 의미하지 않으며 연구 결과가 엇갈리거나 특이한 신호가 감지될 경우, 연구결과는 좀 더 정량적으로 살펴야 함. FDA는 연구결과 해석에 있어 외부 과학적 조언을 구하기 위해 PG를 이용하여 PMA를 관련 자문패널에게 발표

관찰 연구 혹은 레지스트리(observational studies or registries)

  • ‧ 치료효과를 비교하기 위해 임상 데이터베이스를 검토하는 것은 편향(bias)을 동반함. 임상연구에서 무작위 할당이 예후에 기초한 치료 할당을 방지하는 반면, 임상결과를 담고 있는 관찰연구와 레지스트리에는 편향 통제 확증방법이 없음
  • ‧ 무작위 임상연구 결과가 관찰연구에서 보고된 것과 유의하게 다르다는 것을 보여주는 연구 사례들이 있는데 불일치에 대한 한가지 설명 가능한 것은 관찰연구에서 중재 할당(intervention assignment)이 환자 예후에 좌우될 수 있다는 것임
  • ‧ 역학연구에 사용되는 다른 디자인은 중요한 공변량(covariates)을 매칭(matching)시켜 선택된 1개 이상의 대조군 환자 사례를 요구하는 것으로 선택된 사례가 전체 대상 환자군의 하위군(subset)에서 반비례로 선택되고 대조군이 대상 환자군을 대표하지 않을 수 있어 매칭은 문제를 내포하고 있음
  • ‧ 관찰연구 형태는 진단 혹은 치료 목적 의료기기 여부를 떠나서 시판전 연구에서는 권장되지 않으나 특정 의료기기의 특이적 사건과 연관성이 있는 경우 시판후 연구에서 유용

메타 분석
(meta-analysis)

  • ‧ 새로운 임상데이터 생성 없이 안전성 및 효과성을 입증하기 위한 시도로 메타분석을 이용하는 것은 잠재적인 편향을 유발할 수 있는데 유의성이 없는 결과 혹은 열악한 결과(poor outcome)를 보인 연구는 일반적으로 출판되지 않기 때문
  • ‧ 이러한 연구 디자인이 유용한 드문 사례에서 선택편향(selection bias)을 최소화하기 위해 정확한 통계방법을 적용하고 출판된 임상문헌을 선택하기 위한 포함 및 거부 기준을 미리 정한 엄격한 질 통제가 중요
  • ‧ 메타분석에 잘 수용된 방법론은 분석을 시도하기 전에 메타분석에 포함시킬 연구 선택(가령, 무작위 임상연구)을 위한 기준의 확인임. 이러한 접근방법은 전향적 메타분석(prospective meta-analysis)이라고 할 수 있음
  • ‧ 대다수 출판된 문헌은 개별 연구 내에서 데이터의 독립적인 분석을 가능케 하는 환자수준 데이터(subject-level data) 혹은 충분한 세부사항을 포함하지 않기 때문에 중대한 결함이 있음
  • ‧ 다른 일반적인 우려사항으로 연구 전반에 걸친 일관성 없는 포함/배제 기준, 연구결과(endpoint) 정의의 상당한 차이, 환자 추적관찰 기간의 차이가 있음. 메타분석에서 제조회사가 판매하기 원하는 의료기기의 임상연구만을 포함하는 것이 중요

문헌 요약
(literature summary)

  • ‧ 자격을 갖춘 전문가가 시행한 잘 기술된 사례 역사, 시판된 의료기기 대상의 중대한 사람 대상 경험 보고서를 포함
  • ‧ 새로운 임상데이터는 생성되지 않지만 새로운 분석이 시행되지 않는다는 점에서 메타분석과 상이함. 문헌 요약을 포함하는 PMA는 선택된 출판 문헌에서 시행된 분석과 잠재적으로 특정 임상연구자의 잘 기술된 경험에 좌우됨
  • ‧ 메타분석 사용보다 좀 더 중대한 한계점이 있기 때문에 효과성을 입증함에 있어 커다란 유용성을 보이지 않음

임상결과연구에서 일반적인 연구디자인의 장점 및 단점은 아래와 같다.

임상결과연구

장점

단점

무작위, 이중 맹검, 비교, 평행군 임상연구(randomized, double-blinded, controlled, parallel group clinical study)

  • ‧ 가장 강한 수준의 과학적 근거와 최소의 편향을 보이기 때문에 동등성 연구 디자인을 고려할 때 일반적으로 선호
  • ‧ 이중 맹검은 환자 혹은 연구진(연구자 혹은 3자 평가자 포함)이 할당된 중재술을 모르는 것을 의미
  • ‧ 연구 및 대조군의 환자군이 비슷하고 안전성 및 효과성 결과에 영향을 끼칠 수 있는 알려진/알려지지 않은 기선 변수(baseline variables) 측면에서 양군간 체계적 차이를 피할 수 있는 가장 높은 수준의 확증을 제시
  • ‧ 활성 대조군 고려시 우월성(superiority) 입증 연구인지 활성 대조군과의 비교에서 비열등성(non-inferiority)을 보고자 함인지 여부가 중요
  • ‧ 디자인 실행이 가능하지 않거나 현실적이지 않은 의료기기가 있음
  • ‧ 연구 설계에서 이탈된 경우 문제가 발생하는데 플라시보 효과 혹은 주관적인 결과 측정이 연구결과(endpoint)로 사용되는 경우가 해당
  • ‧ 플라시보 대조군 사용이 연구대상 의료기기의 편익과 위험에 대한 직접적 근거를 제시하여 바람직하지만 대조군에서 환자 치료기회를 박탈하는 문제를 야기
  • ‧ 활성 혹은 플라시보 대조군 선택은 윤리 및 현실적인 고려에 따라 이루어져야 함

무작위, 환자 자가대조군, 쌍 임상연구(randomized, subject as own control, paired clinical study)

  • ‧ 환자는 동시 연구 및 대조군 중재술로 치료받고 무작위 중재술 할당이 시행. 의료기기 효과가 국소적으로만 명확할 경우 가능한 연구 방식
  • ‧ 적절하게 사용시 2개 중재술 효과가 동일 환자에서 측정되고 변동성이 적어 적은 샘플 크기로도 가능한 장점 있음
  • ‧ 2개군 교차연구 설계는 개별환자가 무작위 할당 순서로 연구 및 대조군 중재술을 순차적으로 받고 개별 환자의 연구용 의료기기 및 대조군 중재술 성과 비교 가능
  • ‧ 체계적인 안전성 혹은 효과성 결과 평가 및 구별이 불가능
  • ‧ 교차연구는 첫 번째 중재술 효과가 두 번째 중재술로 이전(carry over)되지 않는 가정하에 실시. 이러한 가정이 적절하지 않은 경우, 중재술 간에 오랜 기간(“washout period”)이 연구에 반영되야 함

무작위, 비맹검, 동시 대조군 연구 (randomized, non-blinded study with concurrent control (active, placebo or “no intervention”)

  • ‧ 불완전한 맹검은 환자, 연구자 혹은 제3자 평가자가 맹검되지 않은 경우를 의미하며 맹검이 되지 않은 경우 “open-label study”로 분류
  • ‧ 환자, 연구자, 제3자 평가자가 할당된 중재술에 맹검될 경우, 비교 임상연구에서 편향이 최소화됨
  • ‧ 활성 혹은 플라시보 대조군의 경우, 환자 혹은 연구자 맹검이 항상 가능하지는 않으며 간혹 제3자 평가자 맹검 또한 어려움(가령, 연구대상 의료기기와 활성 대조군 의료기기는 영상사진에서 완전히 다른 모습을 나타냄)
  • ‧ 대조군이 “최상의 약물치료(best medical management)” 혹은 “무중재술(non-intervention)” 인 경우, 환자 및 연구자 모두 맹검되지 않음. 결과적으로 모든 대조군 환자들은 연구용 의료기기로 치료되지 않음을 알게 되어알려지지 않은 규모의 편향을 야기
  • ‧ 연구참여자가 맹검되지 않은 경우, 편향 규모 평가가 매우 어렵고 진정으로 객관적 연구결과(endpoint)가 이용됨에도 불구하고 견고한 연구의 과학적 타당도를 위협
  • ‧ 연구 참여자(환자, 연구자, 평가자) 맹검이 불가능한 경우, 자세한 사유와 편향 관련 우려를 해결할 제안 조치 관련 설명이 FDA에 제시되야 함

비무작위, 동시 대조군 연구(non-randomized study with concurrent control (active or placebo or “no intervention”)

  • ‧ 환자 및 연구자 모두 할당된 중재술에 맹검되지 않음
  • ‧ 무작위, 비맹검, 동시 대조군 연구의 모든 결점을 안고 있음
  • ‧ 무작위할당이 없고 환자는 가능한 중재술 가운데 한가지로 치료되어 중재술 할당으로 인해 알려지지 않은 크기의 편향 발생 가능성이 매우 높음
  • ‧ 무작위 임상연구 만큼 노동 집약적이기 때문에 일반적으로 권고되지 않지만 측정되지 않은 차이로 발생 가능한 혼란변수(confounding)를 내포하여 환자군, 의료기관, 연구자 차이로 인해 더 많은 편향을 유발
  • ‧ 전체적으로 임상연구에 대한 두 가지 중재술군 간 균형을 맞추지만, 개별 참여 연구자간 균형이 이루어지지는 않아 연구자-의료기기 상호작용(investigator-by-device interaction)으로 인해 연구용 의료기기 장점은 연구자간 차이를 보일 수 보임

기선 비교 단일군연구(single-group study compared to baseline)

  • ‧ 많은 치료용 의료기기 연구의 대조군으로 환자 기선 상황(baseline status)을 이용하는 것이 솔깃하지만 활성 혹은 플라시보 대조군을 이용하여 무작위 할당군을 갖는 것이 권고됨
  • ‧ 맹검 연구에서 무작위로 할당된 환자군은 더 엄격한 대조군을 제공하며 플라스보 효과 편향과 시간 편향(temporal bias)을 피할 수 있음

 

단일군 역사적 대조군 혹은 정보연구(single-group study with historical control or information)

  • ‧ 의료기기 기술이 잘 확립되어 있고 관심 대상 질환이 잘 이해된 경우 시행
  • ‧ 이용 가능한 환자수준 데이터의 역사적 대조군과 비교하고 과거 및 현행 연구 모두에서 개별 환자의 모든 중요한 변수를 포함한 환자수준 데이터가 이용 가능할 경우, 몇 가지 통계적 비교가 가능. 역사적 대조군이 현행 연구 환자군과 비슷하다는 것을 입증하는 것이 도전과제임
  • ‧ 현행 연구가 완성된 후, 성향점수 모델(propensity score model)을 이용하여 2개 군의 비교가능성을 평가하는 것이 가능하나 데이터가 비슷하지 않으면 상당한 위험이 있음 
  • ‧ 환자가 모집되고 기선이 수집되고 분석되기까지 비교가능성을 평가할 수 있는 방법이 없기 때문에 이러한 접근방식은 위험할 수 있음
  • ‧ 양 군이 동시에 존재하지 않기 때문에 역사적 대조군 사용에 내재된 명확한 편향이 시간 편향(temporal bias)임
  • ‧ 과거 정보에서 도출된 OPC 혹은 PG 비교: 역사적 대조군이 없는 경우, 의료기기 성능은 안전성 혹은 효과성 연구결과(endpoint) 관련하여 수치화된 목표값(OPC 혹은 PG)과 비교하여 평가. 역사적 대조군과 비교로 인한 모든 도전과제 혹은 제한점을 공유하고 있음
  • ‧ 역사적 대조군의 환자결과를 식별할 수 없거나 목표한 현행 대상군에 적용 불가
  • ‧ 현행 환자군이 OPC 혹은 PG가 도출된 역사적 군과 얼마나 비슷한지 평가할 수 있는 독립적 방법이 없고 편향 정량화가 불가능
  • ‧ 임상연구에 참여한 대조군이 없어 OPC 혹은 PG와의 비교는 우월성(superiority) 혹은 비열등성(non-inferiority)을 입증 불가

 

시사점
• 임상연구는 임상 및 통계적 유의성 모두를 보여주도록 설계되야 함
• 타당한 과학적 근거는 의료기기 특성, 사용 조건, 경고 및 제한사항 여부 및 적정성, 사용 경험 정도에 따라 다름
• FDA는 의료기기의 경우 무작위할당이 불가능하고, 어려우며 잠재적으로 부적절한 경우가 있음을 인정하고 있으며 연구자들은 환자를 무작위 연구에 권고함에 있어 윤리적 딜레마에 직면할 수 있음

자료출처 : Design Considerations for Pivotal Clinical Investigations for Medical Devices: Guidance for Industry, Clinical Investigators, Institutional Review Boards and Food and Drug Administration Staff

US FDA Center for Devices and Radiological Health / Center for Biologic Evaluation and Research. November 7, 2013
https://www.fda.gov/downloads/MedicalDevices/DeviceRegulationandGuidance/GuidanceDocuments/UCM373766.pdf

* 본 컬럼은 의료기기를 비롯한 헬스케어 분야의 국내외 학회지에 발표된 논문 및 연구보고서 등을 살펴봄으로써 우리나라 의료기기 관련 보건의료정책 마련에 통찰력을 제공하기 위한 목적으로 매주 발표됨

키워드

#N
저작권자 © 의료기기뉴스라인 무단전재 및 재배포 금지