오세훈 시장이 신속진단키트를 도입하기로 한 것과 관련해 논란이 많습니다.

저는 이 이슈가 지금은 오 시장을 공격하는 데 사용되고 있지만, 몇달 전만 해도 보수세력이 정부를 공격하는 데 사용됐다는 점이 놀랍습니다.

위치와 이념에 따라, 피상적인 면만 짧게 본 감성적 느낌과 비이성적인 판단에 의한 행태가 싫습니다.

반대를 위한 반대, 개판오분전에 양극화된 한국정치의 현실의 한 사례를 보는 것 같아 안타깝습니다.

저 개인적으로 키트에 대한 효능에 대해 판단하는 바가 있긴 하지만, 방역/의료/백신 전문가가 아니라서 제 주장보다는 드라이한 수치와 그에 따른 사고실험 결과를 정리해 보았습니다.



감염자/비감염자를 구분하는 것과 같은 이진분류 문제에서 분류기법(여기서는 키트)의 성능은 특이도와 민감도로 평가합니다.

특이도는 1종오류가 발생하지 않는 정도입니다. 감염병 진단 문제에서는 비감염자에 대해 양성이 나올 확률입니다.

민감도는 2종오류를 발생하지 않는 정도입니다. 감염병 진단 문제에서는 감염자에 대해 음성이 나올 확률입니다.



작년 하순에 나온 SD바이오센서의 신속진단키트에 대한 FDA 보고서에는 아래와 같은 표가 있습니다. (https://www.accessdata.fda.gov/cdrh_docs/presentations/maf/maf3274-a001.pdf)

이 키트는 76.7%의 민감도와 98.8%의 특이도를 보인다고 나오네요.

http://www.biospectator.com/view/news_view.php?varAtcId=11257
위 기사를 보시면 작년 말에 수젠텍에서 나온 키트는 97%의 민감도와 100%의 특이도를 보인다고 합니다.



하지만 최근들어 키트의 민감도가 40%, 심한 경우에 20%도 안 된다는 점에서 오 시장이 비판받고 있습니다.

오 시장의 키트가 위 것들과 다른 종류라 그런걸까요?

같으면 상관없고, 다르더라도 키트 기술수준이 오십보백보인데 큰 차이는 없을 것이며 설사 극명한 차이가 있더라도 위 키트를 쓰면 되니 문제 될 여지는 없겠죠.



사실 민감도가 90%와 20%를 넘나드는 것에는 다른 이유가 있습니다.

높은 민감도는 중증환자를, 낮은 민감도는 무증상 감염자를 대상으로 한 실험의 결과거든요.

키트는 검체에 포함된 바이러스의 양에 따라 신뢰도가 크게 좌우되는데, 중증환자의 검체가 훨씬 많은 바이러스를 포함하고 있으니 민감도도 높게 나오는 것입니다.

특이도는 검사 자체에 내재된, 혹은 외부 상황의 불확실성에 의한 것이라 두 경우에 차이가 없습니다.

종합하자면 키트는 무증상 감염자에 대해 동전 던지기만도 못한 민감도를 가지지만 비감염자는 거의 대부분 걸러내는 성능을 가졌다고 볼 수 있습니다.

서울 시 사례에서 키트의 용도를 볼때 중증환자에 대한 높은 민감도는 큰 의미를 가지지 않습니다.



이제 이 키트에 대해 간단한 사고실험을 해 보겠습니다.

대상: 총 1000명의 인구 중 1%의 무증상 감염자가 돌아다니는 가상의 도시 소울 (실제 서울은 무증상 감염자가 몇%일까요?)
키트: 민감도 20%, 특이도 100%

감염자 비감염자
10 990
음성 8 990
양성 2 0

음성인 사람이 비감염자일 확률은 99.2% (990 / (8 + 990)), 양성인 사람이 감염자일 확률은 100% ((2 / (2 + 0))입니다.

개별 사례로 보면 2명의 감염자를 조기에 걸러내었습니다.

민감도 20%의 저급한 키트가 99%를 넘는 분류성능을 보이고 있는데, 이러한 차이에는 크게 두 가지 요인이 있습니다.

1. 100%라는 완벽한 특이도

2. 감염자에 비해 비감염자가 훨씬 많음



각 요인을 하나씩 완화해 보며 비교해 보도록 하겠습니다.

첫 비교실험은 특이도가 거의 99%인 경우입니다. 99%도 정말 높은 수치입니다.

감염자 비감염자
10 990
음성 8 980
양성 2 10

음성인 사람이 비감염자일 확률은 여전히 99.2%로 굳건하지만, 양성인 사람이 감염자일 확률은 100%에서 16.7%가 됐습니다.



두 번째 비교실험은 감염병 확산이 심각해 소울에 감염자가 50%일 경우입니다.

감염자 비감염자
500 500
음성 400 500
양성 100 0

양성인 사람이 감염자일 확률은 100%지만 음성인 사람이 비감염자일 확률은 55.5%가 됐군요.



위 사고실험과 같이 민감도, 특이도로 표현되는 검사의 성능은 연관된 변수가 많아 피상적인 면만 보고 판단한 것과 상당히 다를 수 있습니다.

감염병 관련 전문가 그룹 중 하나인 의사들에게 위 내용과 비슷한 퀴즈를 냈더니 대부분 틀렸더랍니다. 그만큼 판단이 어렵죠.

키트 이슈에 대해 이성적인 판단을 하는 데 조금이나마 도움이 되었으면 좋겠습니다.

생명과 안전이라는 최우선 문제, 조금 더 넓게 생각하면 세금을 어떻게 사용하는지에 대한 문제인데, 이걸 정치적 스탠스와 이념에 따라 판단할 수는 없지 않겠습니까?