이상수의 health policy insight

[Health Policy Insight 423호]

최근 인공지능(artificial intelligence, AI)이 급속도로 발전하면서 의학 분야에서도 AI 개발과 상용화에 막대한 투자가 이루어지고 있다. 2023년 현재, 500개 이상의 의료용 AI 기기가 US FDA 평가를 거쳐 영상의학, 신경학, 병리학 등 분야 전반에 걸쳐 승인을 받았다.

▲&nbsp;이&nbsp;상&nbsp;수<br>메드트로닉 코리아 전무<br>
▲ 이 상 수
메드트로닉 코리아 전무

FDA 제출 과정에서 기기 제조업체는 자사 제품의 유효성 및 안전성에 대한 근거를 보고해야 하며, 이를 통해 AI 알고리즘이 환자에게 사용되기 전에 어떻게 평가되는지에 대한 중요한 통찰력을 제공해야 한다. 그러나, 승인 후에는 기업은 자사 제품을 언제, 어디서 사용되어야 하는지 거의 공유하지 않는다. 따라서 의료용 AI 승인이 급증함에도 불구하고, 실사용(real-world) 사용에 대해서는 알려진 바가 거의 없다. 의료용 AI 기기의 사용 및 채택 패턴은 임상적 영향(clinical impact)에 큰 영향을 미칠 수 있다. 

첫째, AI 알고리즘 성능은 헬스케어 환경의 변화에 매우 민감하고, 배포 중에 변동되기로 악명 높다. 예를 들어, 탐지율(detection rates)이 최대 20% 향상되었다는 초기 연구에도 불구하고, 2000년대 초반 승인된 유방조영술(mammography)에 대한 컴퓨터지원 탐지(computer-aided detection, CAD) 제품은 여성에게 실질적인 편익을 제공하지 않는 것으로 밝혀졌다. 이러한 불일치는 의사의 소프트웨어 상호작용 변화, 필름에서 디지털 유방조영술로의 전환과 같은 채택 및 사용 요인에 기인한다. 결과적으로 AI 의료기기는 특정 평가 조건에서 강력한 성능을 발휘할 수 있지만, 실사용 응용프로그램(application)의 변화에 따라 크게 다른 결과가 나타날 수 있다. 

둘째, 의료용 AI 기기의 영향은 경제적 힘(economic forces)에 의해 매개된다. FDA 승인 후 기업은 AI 기반 헬스케어의 약속을 실현하기 위해 지속 가능한 수익원을 찾아야 한다. 다양한 보험급여(reimbursement) 접근방식은 이러한 기기가 사용되는 빈도와 대상에 영향을 미칠 수 있으며, 새로운 AI 기기에 어떤 모델이 최적인지는 여전히 불분명하다. 의료용 AI 기기의 실증적 사용을 연구하는 것은 의료 혁신의 환경을 특성화하는 중요한 단계이며, 알고리즘에서 환자까지의 변환 파이프라인(translational pipeline)에 대한 보다 전체적인 관점을 제공할 수 있다.

최근에는 의료용 AI 기기를 위해 특별히 ‘Current Procedural Terminology (CPT)’ 코드가 생성되었다. CPT 코드는 ‘건강보험 이동성 및 책무법(Health Insurance Portability and Accountability Act, HIPA)’에 따라 미국 보건성(U.S. Department of Health and Human Services, HHS)에 의해 미국 보험청(Centers for Medicare & Medicaid Services, CMS)이 사용하는 의사 및 기타 의료 전문 서비스 및 시술(physicians and other health care professional services and procedures)에 대한 국가 코딩세트(national coding set)로 지정되었다. 이 코드는 미국의사협회(American Medical Association, AMA)에 의해 정기적으로 생성, 업데이트 및 수정되며, 공공 및 민간 건강보험 프로그램에서 가장 널리 인정되는 의료명명법(medical nomenclature)이다. 

의료공급자는 이러한 코드를 사용하여 진료 중에 환자에게 제공되는 특정 서비스를 자세히 설명하는 항목별 청구서를 생성한다. 그 후, 이러한 청구서는 보험회사에 제출되며, 보험회사는 코딩된 정보를 사용하여 제공된 서비스에 대한 적절한 보험급여를 결정한다. 따라서 CPT 코드는 의료 청구서의 정확성과 통일성을 보장하고, 헬스케어 시스템에서 책무성과 투명성을 높이는데 중요한 역할을 한다.

미국 보험청은 또한 의료공급자가 신기술을 채택하도록 장려하기 위해 특별히 고안된 ‘신기술 추가 지불보상(new technology add-on payment, NTAP)’을 통해 의료 AI 기기에 대한 보험급여를 제공한다. 그러나 NTAP 프로그램은 특히 입원환자 지불보상에 중점을 두는 반면, CPT 코드는 입원환자 및 외래환자 환경 모두에 적용된다. 의료 AI 기기에 사용할 수 있는 CPT 코드 수가 증가하고 있지만 이러한 코드는 일반적으로 다양한 의료영역에 분산되어 있으며, 의료 코더(medical coders) 및 보험 회사를 위해 사용된다. 따라서 현재 AI 관련 CPT 코드에 대한 단일 데이터베이스나 사용법에 대한 체계적인 분석이 존재하지 않는다. 본 논문은 의료 AI 기기에 적용되는 CPT 코드의 포괄적 목록을 식별하고 정리하였다.

본 연구에 따르면 FDA 승인된 AI 제품의 상용화는 아직 초기 단계이지만 증가하고 있으며, 2022년 이후 CPT 코드의 50% 이상이 유효하다. 그러나 이러한 기기 가운데 소수만이 상당한 시장 채택에 도달했으며, 이는 의료 AI 환경이 아직은 초기 단계임을 보여준다. 이러한 사용 패턴은 임상 실행의 문제, 지불보상 및 평등한 접근성을 포함하여 의학에서의 AI 배포와 관련된 주요 주제를 강조한다. 의료 AI의 성공적인 임상 채택에는 주요 실행 장벽을 극복하는 것이 포함된다.

첫째, AI를 추가하려면 임상 업무흐름(clinical workflow)에 상당한 변화가 필요하다. 예를 들어, 연구에서는 당뇨병성 망막증 감지 알고리즘(diabetic retinopathy detection algorithm)의 성공이 환자 동의, 인터넷 속도 및 연결성, 그리고 열악한 조명 조건(lighting conditions)과 같은 전개 요인(deployment factors)에 의해 어떻게 매개되는지 자세히 설명했다. 또 다른 연구에서는 병리학에서 AI 알고리즘의 추가적인 편익이 있음을 발견했는데, 병리학자의 알고리즘 산출(outputs)과의 상호작용에 따라 달라진다. 더욱이 임상 진료에 대한 AI 알고리즘의 가치는 헬스케어 환경의 함수이다. 예를 들어, 연구자들은 당뇨병성 망막병증 알고리즘을 사용하는 진료소(clinics)가 평가되는 매 환자마다 적자로 운영될 수 있다고 주장하며 채택을 독려하기 위해서는 기존 지불보상 구조의 수정을 제안했다. 그러나 환자는 최첨단 기술을 제공하는 진료소를 방문하도록 장려될 수 있다. 의료 AI 기기는 광범위한 채택을 위해 의료공급자에게 명확한 가치 제안을 제공해야 하지만, AI의 가치는 다면적이며 맥락에 따라 다르다. 특히, 의료용 AI에 대한 메디케어 가격책정은 현재 AI의 가치가 어떻게 평가되는지에 대한 통찰력을 제공할 수 있다. 

CPT 코드에 대한 보험급여 금액은 의사 업무량(physician work), 진료 비용(practice expense), 의료과실(malpractice) 비용이라는 3가지 요소를 기반으로 결정된다. 특정 코드의 경우, 각 요인은 시술 간 차이를 설명하기 위해 조정된 상대가치 단위(relative value unit, RVU)와 관련이 있다. 예를 들어, 의사 업무량에 대한 RVU가 높다는 것은 시술에 더 많은 의사 시간 및/또는 전문지식이 필요하다는 것을 의미한다.

의료 AI 기기의 핵심 가치제안은 의사의 업무부담을 줄이거나 없애는 능력이다. 이는 미국 보험청 수가(fee schedule)의 CPT 코드 92229(당뇨병성 망막증) 가격책정에 반영되어 있다. 의사 업무량에 대한 상대가치가 0임에도 불구하고, 이 코드의 진료비용 상대가치(practice expense relative value, peRVU)는 1.34로, 이는 비AI(non-AI) 코드(CPT 코드 92228, peRVU=0.53)보다 높다. 이 차이는 AI 기기의 가격책정이 일반적으로 의사에게 할당되는 가치 중 일부를 기기 자체의 구매 및 운영비용으로의 전환을 보여준다. 흥미롭게도 당뇨병성 망막증에 대한 민간보험 협상 요율(privately negotiated rate)은 미국 보험청 요율보다 현저히 높다 ($127.81 vs. $45.36). 미국 보험청 요율은 납세자 지원 프로그램(taxpayer-funded programs)에 대한 비용억제를 목표로 고안된 반면, 사보험자는 특정 시장에서 서비스의 실제 비용이나 인지된 가치를 더 잘 반영하는 요율을 협상할 수 있다.

현재 카테고리 III 상태로 인해 대부분의 AI CPT 코드에 대해 메디케어 가격책정이 제공되지 않는다. 그러나, 사보험 데이터에서는 여러 기기의 가격책정이 관찰되었다. 예를 들어, 유방초음파(CPT 코드 0689T–0690T)에 대한 AI 해석의 중위값 협상 보험급여액(median negotiated reimbursement rate)은 $371.55로서, 기존(비AI) 유방초음파의 전국 평균비용인 $360.74와 비슷하다. 그러나, 죽상동맥경화증에 대한 심장 CT의 AI 분석은 중위수 협상요율이 $692.91로, 이는 심장 CT의 평균비용 범위인 $100~$400.75보다 높다.

보험회사가 새로운 AI 기술에 대한 보험급여를 고려함에 따라, 적절한 가격책정을 결정하는 것은 광범위한 AI 채택에서 중요한 단계로 남아 있다. 의료용 AI의 지불보상 메커니즘은 AI의 사용 및 채택 방식에 영향을 미친다. CPT 및 NTAP 방법과 같은 기타 시술기반 청구 방법은 사용량(per-use basis)에 따라 수행되지만 다른 지불보상 방식은 가치나 결과에 따라 조정될 수 있다. 예를 들어, 보험급여 전략에 대한 최근 연구에서는 AI의 한계비용(marginal costs)이 거의 0에 가까워 AI의 남용으로 이어질 수 있기 때문에, 별도의 보험급여를 완전히 포기할 것을 제안했다. 대안에는 특정 임상적 또는 경제적 결과가 충족되지 않을 경우 할인(discounts)을 수반한 고정비용과 AI 개발자 및 헬스케어 시스템 간의 수익공유 거래(revenue-sharing deal)을 포함한다.

다른 결과기반 제도(outcome-based schemes)에는 유럽과 영국의 초기 사례와 같이 시판 후 연구에서 특정 긍정적인 결과가 입증된 경우 더 높은 보험급여 제공이 포함된다. 연구자들은 "접근성 극대화(access-maximizing)" 모델에서 특정 서비스를 받는 적격 환자의 비율을 고려할 것을 제안했다. 최근 진단영상 서비스 회사인 RadNet은 환자가 60달러의 본인부담금으로 유방조영술에 대해 AI 해석을 선택할 수 있는 프로그램을 출시했다. 대학병원의 존재가 의료 AI 도입에 중요한 요소라는 점을 관찰했는데, 대학병원 우편번호(zip codes)의 70% 이상이 대학병원이 없는 우편번호의 경우 9%인 것과 비교하여 의료용 AI 청구가 1건 이상 있었다. 또한 대도시 및 고소득 우편번호는 AI 도입 가능성이 더 높은 우편번호 중 하나이다. 이러한 발견은 디지털 헬스케어 내에서 더 폭넓은 채택 추세를 반영하고, 전기자동차와 같은 다른 신기술에서도 관찰된다. 왜냐하면 더 많은 자원과 인프라를 갖춘 지역이 후속 위험(risks)과 보상(rewards)을 더 잘 감당할 수 있는 위치에 있기 때문이다. 이러한 채택 차이가 반드시 헬스케어 결과의 차이를 의미하는 것은 아니지만, 규제 기관과 이해관계자는 AI가 헬스케어의 영구적인 고정장치가 되면서 발생할 수 있는 공평한 접근성에 대한 잠재적인 장애물을 고려해야 한다.

본 의료용 AI 사용에 대한 분석에는 몇 가지 한계가 있다.
첫째, 160억 건의 청구 데이터세트(IQVIA PharMetricsVR Plus)가 65세 미만의 미국 환자군을 대표하지만, 모든 의료청구를 포착하지는 않는다. 따라서 본 분석에서 보고된 청구 건은 전체 사용량의 일부일 뿐이며, 주로 시간 경과에 따른 상대적 규모를 통해 해석되어야 한다.

둘째, 본 분석은 특히 AI 사용의 모든 잠재적 유형을 포착하지 못하는 CPT 코드에 중점을 둔다. 예를 들어, Viz.ai의 대형 혈관 폐색 감지 알고리즘(large vessel occlusion detection algorithm)과 같은 제품은 메디케어의 NTAP 프로그램에 따라 보험급여가 가능하지만 본 연구에서는 그러한 사용을 포착하지 못했다. 또한, 보험급여되지 않는 임상 시범사업 연구에서 의료용 AI 사용은 대규모 국가 데이터베이스에 나타나지 않는다. 게다가 하드웨어 시스템의 일부로 포함된 AI 소프트웨어에는 별도의 CPT 청구가 포함되지 않는 경우가 많다. 예를 들어, GE의 Edison Digital Health Platform 및 Critical Care Suite는 AMX 및 Definium X-선 시스템의 일부로 포함되어 있지만 별도의 소프트웨어 제품으로는 제공되지 않는다.

본 분석은 또한 비AI 특정 CPT 코드로 청구되는 의료용 AI 기기의 사용을 포착하지 않는다. 예를 들어, CPT 코드 77066은 유방조영술용 CAD에 사용되지만 현재의 딥러닝 기반 접근방식의 사용과 1990년대의 전통적 모델을 구별하지는 않는다. 따라서 유방조영술에 대한 새로운 모델이 개발되고 FDA에 의해 승인되었음에도 불구하고, 청구데이터에서 그 사용을 명확하게 식별할 수 없다. 

본 분석은 특히 모든 의료용 AI의 하위군인 의료기기로서의 AI 소프트웨어(AI Software as a Medical Device)에 중점을 둔다. 예를 들어, 독점적 실험실 분석(proprietary laboratory analyses)에는 수집된 데이터를 분석하는 기계학습 알고리즘이 포함될 수 있다. KidneyIntelX 및 RenalytixAI와 같은 제품은 당뇨병 임상 케어에 AI를 사용하는 반면, PreciseDx는 유방암 검사를 제공한다. 이러한 제품은 CPT 코드에 따라 청구가 가능하지만, FDA를 통해 규제되지는 않는다.

또 다른 예는 전자건강기록(electronic health record) 공급업체 소프트웨어를 통해 구현되는 경우가 많은 AI 진료관리 소프트웨어이다. 예를 들어, Epic에는 약 20개의 예측 알고리즘이 있는 것으로 보고되었다. 이러한 애플리케이션 역시 FDA의 규제를 받지 않으며, 주로 대규모 소프트웨어 구독의 일부로 비용이 지불된다. 마지막으로 최근 대규모 언어모델의 혁신으로 질문 답변(question-answering) 및 임상 메모작성(clinical note-taking)과 같은 영역에 대한 응용프로그램이 등장했다. 그러나 이러한 제품은 아직 임상적으로 검증 및 규제되지 않았다.

CPT 코드는 미국 내 사용을 위해 미국의사협회에서 개발되었으므로, AI 채택에 대한 본 분석은 다른 국가에 직접적인 통찰력을 제공하지 않는다. 그러나 AI의 임상채택에 대한 광범위한 추세는 기저의 AI 기술의 유사성과 의료공급자의 인센티브로 인해 국가 간에 공유될 수 있다. 이와 동시에 여러가지 요인이 미국을 AI의 독특한 시장으로 만든다. 예를 들어, 단일 보험자 시스템과 달리 미국에는 사보험과 공보험이 혼합되어 있으며, 미국 보험청이 지불보상 정책을 수립하고 사보험자가 나중에 이를 따른다.

규제기관 간의 차이도 AI에 대한 제공업체의 신뢰 정도에 영향을 미친다. 예를 들어, FDA 승인을 받으려면 항상 완전한 임상시험이 필요한 반면, CE마크는 기존 기기에서 발표된 데이터의 검토를 허용한다.

마지막으로, AI 헬스케어 시장은 미국에서 훨씬 더 크며, 2022년에는 북미 지역이 글로벌 시장의 거의 50%를 차지한다. 이러한 요소는 제품 투자 및 개발부터 보험급여 및 사용에 이르기까지 전체 AI 채택 파이프라인에 영향을 미친다. 

전체 청구에 비해 AI 사용량이 차지하는 비율이 적다는 점은 AI 활용에 대한 내재적 장애물과 현재 AI의 임상적 유용성 및 필요성을 강조한다. AI CPT 코드는 AI 성숙도 측면에서 최전선(frontier)을 나타내지만, 이는 의료용 AI를 널리 채택하는데 필요한 여러 단계 중 하나일 뿐이다. 예를 들어, CE마크가 있는 영상의학 AI 기기에 관해 의료공급자 대상 설문조사에서는 예산책정 및 정보기술 통합과 관련된 활용의 주요 장애물을 발견했다 - 이는 임상적 검증 범위를 넘어서는 이슈임. 따라서 본 연구결과는 AI를 성공적으로 활용하려면 AI 기술의 전체 변환 파이프라인(translational pipeline)을 이해해야 한다는 사실을 반영한다.

의료용 AI의 사용 및 채택은 AI 개발자, 의료공급자, 보험자 및 환자가 포함된 복잡한 생태계의 산물이다. 지난 몇 년간 AI 기능이 급속히 성장했지만, AI 모델이 의미 있는 임상적 영향을 미치려면 알고리즘 개발 이상의 힘에 대한 신중한 고려가 필요하다. 따라서 의료용 AI의 사용 및 임상 채택을 모니터링하는 것은 이러한 신기술이 광범위한 환자군에 대한 헬스케어 질 향상이라는 약속을 이행하는지 확인하는데 중요하다.

시사점
· 의료용 AI 기기 채택은 아직 초기 단계이며 대부분의 사용은 소수의 주요 기기에 의해 주도됨
· 의료용 AI의 지불보상 메커니즘은 AI의 사용 및 채택 방식에 영향을 미침

출처원: Characterizing the Clinical Adoption of Medical AI Devices through U.S. Insurance Claims
Wu K, et al. NEJM AI 2023;1(1). DOI: 10.1056/AIoa2300030.
https://ai.nejm.org/doi/pdf/10.1056/AIoa2300030

* 본 컬럼은 의료기기를 비롯한 헬스케어 분야의 국내외 학회지에 발표된 논문 및 연구보고서 등을 살펴봄으로써 우리나라 의료기기 관련 보건의료정책 마련에 통찰력을 제공하기 위한 목적으로 매주 발표됨 

저작권자 © 의료기기뉴스라인 무단전재 및 재배포 금지