So testi prisotnosti protiteles za SARS-CoV-2 tako zanesljivi, kot se zdi?

Foto: Colin D via Unsplash.

V tem času se povsod po svetu vrstijo testiranja z različnimi vrstami testov, ki naj bi pripomogli pri ugotavljanju prekuženosti prebivalstva. Med njimi je (med prvimi) tudi Slovenija. Ob tem se poraja (globalno) vprašanje: ali lahko ob vseh spremenljivkah in neznankah zares določimo, kako zanesljivi so rezultati in ocene prekuženosti, ki jih ti testi podajo?

Pretekli teden so na vladni novinarski konferenci predstavili rezultate Nacionalne raziskave o razširjenosti COVID-19 v Sloveniji. Na povabilo se je odzvalo 1368 ljudi. Od tega so 1367 preiskovancem odvzeli bris nosno-žrelnega predela, 1318 preiskovancem pa so odvzeli tudi vzorec krvi. Bris je bil pozitiven pri dveh preiskovancih, test za prisotnost protiteles pa je bil pozitiven pri 41 preiskovanih osebah, kar naj bi pomenilo, da je imelo 3,1 odstotka preiskovancev v krvi protitelesa proti novemu koronavirusu.

Po besedah raziskovalcev lahko torej z 98-odstotno gotovostjo sklepamo, da je prekuženost prebivalcev Slovenije znašala med 2,1 – 4,4 %. V stik z novim koronavirusom naj bi tako prišel vsak trideseti Slovenec oziroma Slovenka.

Zasnova in izpeljava takega testiranja je nedvomno velik projekt, na katerega smo lahko ponosni tudi v mednarodnem merilu.

Po drugi strani pa se lahko ob testiranju pojavijo tudi zadržki ob interpretaciji rezultatov, saj lahko majhne razlike v občutljivosti in specifičnosti uporabljenih testov povsem spremenijo sliko oziroma vplivajo na ocene tistih številk (denimo prekuženosti), ki naj bi bile primarni cilj tovrstne raziskave. Poglejmo, kako. 

Do sedaj smo v Sloveniji okužbo s SARS-CoV-2 zaznavali le s testom prisotnosti virusne RNK v vzorcu brisa nosno-žrelnega predela pri tistih osebah, ki so kazale znake okužbe oziroma osebah, testiranih v skladu s smernicami NIJZ-ja. V Nacionalni raziskavi pa so poleg iskanja aktivnih okužb preverjali tudi prekuženost vzorca in posredno populacije z izvedbo serološkega testiranja za prisotnost protiteles za novi koronavirus, ki jih začne naše telo tvoriti ob prebolevanju okužbe.  

Serološki test ima dve lastnosti, in sicer občutljivost (v kolikšnem deležu primerov bodo pravilno zaznali pozitiven vzorec) in specifičnost (v kolikšnem deležu primerov bodo pravilno zaznali negativen vzorec). Če je prekuženost populacije nizka, mora imeti test visoko občutljivost in specifičnost, sicer lahko pride do velike negotovosti in napak pri ocenah prekuženosti na podlagi rezultatov serološkega testiranja. 

PROTITELESA IN SEROLOŠKI TESTI

Protitelesa, ki jih tvorijo imunske celice, prepoznavajo virusne delce, ki se še sproščajo iz okuženih celic, kot tujek in jih zato označijo. Tako jih lahko druge celice imunskega sistema prepoznavajo in uničijo. Obstajajo tudi protitelesa, ki nevtralizirajo virus in ta ni več sposoben povzročiti bolezni ter se širiti. V različnih obdobjih prebolevanja okužbe in po preboleli okužbi se oblikujejo različni tipi protiteles. Imunoglobulini iz razredov A in M so prisotni na začetku prebolevanja, medtem ko imunoglobulini iz razreda G (IgG) vstopijo proti koncu in so tudi dlje časa prisotni v telesu. Pri prebolevanju okužbe z novim koronavirusom je kitajska raziskovalna skupina na vzorcu 285 obolelih s COVID-19 pokazala, da so najkasneje v 19 dni po prvih znakih okužbe zaznali prisotnosti protiteles IgG v vzorcih krvi vseh preiskovanih oseb.  

Pri serološkem testiranju se preverja prisotnost različnih protiteles. Ta lahko pomeni, da ste okužbo že preboleli. Ob upoštevanju ustreznega vzorca populacije bi lahko na temelju teh testov sklepali za celotno Slovenijo, koliko je bilo okuženih oz. kako prisotna je (bila) bolezen med prebivalstvom. 

Vsi trenutno dostopni in potrjeni testi za prisotnost protiteles so še v stanju preverjanja oziroma evalvacije.

Raziskovalci in raziskovalke po vsem svetu še vedno preverjajo, kako uspešno uporabljeni testi zaznavajo resnično pozitivne in tudi resnično negativne vzorce.

Pri evalvaciji je pomembno, da imamo dovolj velik vzorec ljudi, ki so že preboleli COVID-19 in so bili pozitivni tudi na testu prisotnosti RNK v brisu nosno-žrelnega predela. Po preboleni okužbi vzamemo od te skupine ljudi tudi vzorce krvi in dodatno preverimo prisotnost protiteles v krvi. Tako pridemo do določenega odstotka, s katerim določimo občutljivost testa, torej odstotka, v katerem pričakujemo, da bo test pravilno zaznal tiste, ki so resnično oboleli in bolezen tudi preboleli. 

Druga spremenljivka je specifičnost. Vrednost specifičnosti testa določa, kako dobro test zazna resnično negativne vzorce. To lahko ob pojavu novega virusa preverimo z vzorci krvi izpred časa razširjanja novega patogena: ker takratni vzorci zagotovo niso bili izpostavljeni virusu SARS-CoV-2, moramo pričakovati, da bodo vsi pokazali negativen rezultat. Če naletimo na pozitivne rezultate, z njihovim številom določimo odstotek pričakovanih napak ob testiranju. 

Ko imamo rezultate raziskave, lahko ob upoštevanju odstotkov občutljivosti in specifičnosti s preverjenimi statističnimi izračuni napovemo, koliko zanesljiv je pozitiven ali negativen rezultat, ki ga dobimo na testu. 

Pozitivna napovedovalna vrednost opisuje delež pozitivnih rezultatov, ki so pravilno pozitivni. Negativna napovedovalna vrednost označuje delež rezultatov, ki so pravilno negativni

Vrednosti pravilno pozitivnih, lažno pozitivnih, pravilno negativnih in lažno negativnih rezultatov testiranja določajo občutljivost in specifičnost uporabljenega serološkega testa, končne ocene prekuženosti pa so odvisne tudi od dejanske razširjenosti okužb v populaciji. Pozitivna in negativna napovedovalna vrednosti torej povesta, kako zanesljiv je končni rezultat testa oziroma kakšna je verjetnost, da ste ob pozitivnem rezultatu testa prisotnosti protiteles za virus SARS-CoV-2 bolezen COVID-19 že preboleli, ali obratno, da je v primeru negativnega rezultata testa niste. 

V analizi smo zaradi poenostavitve uporabili vedno enako občutljivost testov 95 %.

Napovedi iz modelov razširjenosti COVID-19 ocenjujejo, da je v Sloveniji in po svetu prekuženost nizka, zato za čim bolj točne ocene potrebujemo zelo specifične teste.

Kot spodnji prag smo določili specifičnost 98 %, kot zgornjo vrednost ocenjene specifičnosti (99,8 %) smo vzeli trenutno enega izmed najboljših testov na tržišču (nekatere analize obstoječih testov so dostopne tukaj in tukaj).

Tabela 1: Ocena pozitivne in negativne napovedovalne vrednosti v vzorcu, v katerem je razširjenost prisotnosti protiteles v vzorcu 1 %. Pri izračunu smo sledili izračunom za določanje pozitivne in negativne napovedovalne vrednosti, za lažjo predstavo si lahko pogledate tudi enega izmed spletnih kalkulatorjev (tukaj in tukaj).

občutljivost [%]specifičnost [%]pozitivna napovedovalna vrednost [%]negativna napovedovalna vrednost [%]
99,599,882,799,9
99,599,461,599,9
99,59949,099,9
99,598,539,099,9
99,59832,499,9

 

ANALIZA REZULTATOV SEROLOŠKIH TESTIRANJ

Ko poznamo vrednosti opisanih spremenljivk, ju je treba upoštevati kot korekcijo zbranih podatkov. To naredimo z uporabo modelov binomske porazdelitve: ocenjujemo število obolelih, kjer je vsaka preiskovana oseba lahko bodisi obolela bodisi ne. Pri analizi izhajamo iz osnovnega ogrodja študij Bendavid idr. (2020) in Larremore idr. (2020).

Naj π označuje delež oseb s protitelesi v populaciji, q delež tistih s pozitivno vrednostjo testa v vzorcu, r je občutljivost, s pa specifičnost testa (kot zgoraj). Z uporabo osnovnega Bayesovega izreka in formule za polno verjetnost lahko izpeljemo preprosto korekcijsko formulo (spodaj), ki v izračun razširjenosti bolezni vključuje občutljivost in specifičnost testa. Izračun intervalov zaupanja v empiričnih analizah je narejen z uporabo metod ponovnega vzorčenja.

Vrednosti π, q, r in s se gibajo med 0 in 1.

Določiti moramo verjetnost, da je katerikoli posamezni test prisotnosti protiteles, katerega rezultatov še ne poznamo, pozitiven. Ta verjetnost je odvisna od razširjenosti protiteles v vzorčni populaciji ter od specifičnosti in občutljivosti testa. Zgornja formula lahko vodi v dve različni situaciji. Izračun z njeno pomočjo je mogoč, kadar je člen, ki ga odštejemo zgoraj in spodaj v ulomku (1-s), torej ena minus specifičnost testa, manjši od razširjenosti virusa. Če bi bilo drugače, da bi bila razlika večja ali enaka, bi lahko bili vsi s pozitivno vrednostjo testa v vzorcu lažno pozitivni in ne bi mogli izključiti možnosti ničelne razširjenosti, kar bi pomenilo, da na osnovi izračuna ne bi mogli sklepati o razširjenosti virusa med prebivalstvom.

Dokler so torej zgornji pogoji izpolnjeni, lahko iz vzorčne razširjenosti protiteles z uporabo te formule korektno sklepamo na prekuženost populacije. Oglejmo si primer testiranja protiteles za SARS-CoV-2. Že omenjena raziskava navaja osnovno razširjenost oseb s protitelesi pri testiranju 1,5 %; prilagojeni izračun ob upoštevanju značilnosti testa poda 1,2 %, z utežitvijo in prilagoditvijo glede na značilnosti vzorca 2,8 %, pri čemer sta specifičnost testa 99,5 % in občutljivost testa 82,8 %. Če pa je specifičnost le malce manjša, denimo v vrednosti 98 % ali celo 97 %, se pri nizkih stopnjah prekuženosti, kot to velja za večino primerov obolelosti s COVID-19, kjer govorimo o vrednostih med 0,5 in 2 %, izračun hitro “zlomi” in ne privede do vrednosti, iz katerih bi lahko sklepali na vrednosti prekuženosti v skupnem prebivalstvu. 

Za ilustracijo lahko privzamemo različne vrednosti specifičnosti in občutljivosti serološkega testa in z uporabo znanih podatkov izrišemo različne grafe porazdelitve prekuženosti prebivalstva Slovenije ob upoštevanju različnih ocen občutljivosti in specifičnosti uporabljenega testa (Tabela 2). 

Tabela 2: Različne vrednosti občutljivosti in specifičnosti testa ter ocene povprečja prekuženosti populacije z 98 % verjetnim intervalom. Podatki o rezultatih testiranja so povzeti po Nacionalni raziskavi o razširjenosti COVID-19 v Sloveniji. Število pozitivnih testov je 41, število negativnih testov pa 1277. 

občutljivost testa [%]specifičnost testa [%]ocena povprečja prekuženosti populacije [%] 98 % verjetni interval  [%]
1001003,12,1 – 4,4
10099,832 – 4,2
9599,42,71,6 – 4
95992,31,2 – 3.6
9598,51,80,7 – 3.1
95981,30,2 – 2,6
95970,50,01 – 1,6

 

Krivulje na grafih predstavljajo končno, posteriorno porazdelitev ocen prekuženosti. Ta je odvisna od lastnosti (občutljivosti in specifičnosti) testa in deleža pozitivnih rezultatov na serološkem testu v vzorcu.

UPORABA OCEN IZ MODELOV ŠIRJENJA OKUŽB ZA RAZLAGO RAZISKAVE S SEROLOŠKIM TESTIRANJEM

Rezultate serološkega testiranja za oceno prekuženosti populacije lahko ovrednotimo tudi z uporabo ocen razširjenosti okužb v populaciji, ki jih pridobimo iz različnih modelov. Eden izmed takšnih je model londonske šole za higieno in tropsko medicino (LSHTM). S pomočjo deleža smrtnosti zaznanih primerov (case fatality rate) so ocenili, kolikšen delež aktivnih okužb zaznajo v različnih državah z uporabo testa za prisotnost virusne RNK.

Njihove zadnje ocene so bile narejene na osnovi uradnih podatkov za Slovenijo z dne 28. aprila. Do takrat je bilo v Sloveniji 1418 zaznanih okužb, umrlo je 89 obolelih. Raziskovalna skupina iz LSHTM je ocenila, da smo v Sloveniji zaznali 17 % (95 % CI 11–31 %) aktivnih simptomatskih okužb. Iz tega lahko ocenimo, da je bilo do takrat v Sloveniji povprečno število obolelih 8300 (4600–11800). Znano je, da nekatere okužene osebe ne kažejo znakov bolezni COVID-19, tu gre za asimptomatske primere. Teh naj bi bilo (ocena) med 20 do 80 %. Tako lahko našemu izračunu dodamo še vsaj 40 % asimptomatskih primerov. Po tem izračunu naj bi bilo v Sloveniji do konca aprila okoli 13.900 okuženih (od 7.600 do 19.700) oziroma 0,7 % (0,4–1 %) celotne populacije. Lahko pa vzamemo zgornjo oceno asimptomatskih okužb (= 80 %) in preračunamo, da bi lahko imeli največ 41.700 (med 22.900 in 59.100) okuženih oziroma najverjetneje 2 % (1,1–3 %) celotne populacije.

Na podlagi izračunov ocen dejanske razširjenosti okužb v Sloveniji smo glede na ocene v dosedanjih modelnih raziskavah privzeli, da bi lahko bila prekuženost pol-, eno- ali triodstotna.

Tako je bilo v vzorcu 1000 preiskovanih oseb 5, 10 ali 30 pozitivnih na serološkem testu. Če bi uporabili popoln test, bi bila prekuženost torej pol-, eno- ali triodstotna. 

Občutljivost vseh testov smo predvideli na 95 %, specifičnost smo predvideli v vrednostih 99,8, 99,4, 99,0, 98,5 in 98,0 %. Kako se torej spreminja ocena prekuženosti glede na predvidoma uporabljen serološki test z zgoraj omenjeno občutljivostjo ob različnih možnih stopnjah specifičnosti?

Krivulje na grafih so izrisane s pomočjo analize, ki jo je pripravila ameriška raziskovalna skupina (Larremore idr. 2020). Ta vključuje zgoraj opisano korekcijsko formulo in uporabo Bayesovega modeliranja. Krivulje na grafih predstavljajo posteriorno porazdelitev ocen prekuženosti. Ta je odvisna od lastnosti (občutljivosti in specifičnosti) testa in deleža pozitivnih rezultatov na serološkem testu v vzorcu. V primeru triodstotne prekuženosti v vzorcu lahko vidimo, da to vrednost najbolje oceni test z najvišjo specifičnostjo 99,8 %. Vsi drugi testi jo ocenjujejo kot nižjo, saj je delež lažno pozitivnih, ki ga določa nižja specifičnost testa, v izbranem vzorcu vedno večji. 

Tabela 3: Ocene prekuženosti populacije na osnovi seroloških testov glede na prekuženost v vzorcu

razširjenost protiteles v vzorcu [%]občutljivost testa [%]specifičnost testa [%]ocena povprečja prekuženosti populacije [%]  98 % verjetni interval  [%]
0,59599,80,40,02 – 1,1
19599,80,90,3 – 1,8
19599,40,60,02 – 1,5
39599,831,8 – 4,5
39599,42,61,4 – 4,2
395992,21 – 3,7
39598,51,70,5 – 3,2

V primerih, ko predvidevamo nizko prekuženost na ravni pol ali enega odstotka, lahko opazimo, da samo testi z visoko specifičnostjo ne vključujejo možnosti ničelne razširjenosti protiteles pri osebah v vzorcu, iz česar ne moremo sklepati na prekuženost populacije. Število lažno pozitivnih rezultatov serološkega testa v vzorcu pa narašča z vedno nižjo specifičnostjo testa (Tabela 1). 

Vemo, da smo do 12. maja zaznali že 1461 potrjenih okužb v virusom SARS-CoV-2, torej lahko izključimo možnost, da ne bi bil nihče okužen. Zato lahko sklenemo, da je ob oceni prekuženosti populacije na osnovi rezultatov seroloških testov še veliko negotovosti. 

S KAKŠNO SITUACIJO SE TOREJ SOOČAMO?

Ko želimo z rezultati seroloških testov oceniti prekuženost populacije, prav zaradi nizke prekuženosti prihaja do velike negotovosti. Do ustreznih rezultatov o prekuženosti populacije, če so ti dejansko v okviru 1 ali 2 %, lahko pridemo le z uporabo takšnega testa, ki bi se tako po občutljivosti kot specifičnosti čim bolj približal 100 %. Za meritev višje prekuženosti, na primer 20-odstotne, pa zadoščajo za pravilno oceno tudi manj občutljivi in specifični serološki testi.

Povedano drugače: gre za problem meritve in merila. Če bi na primer želeli izmeriti neko dolžino v milimetrih, bi se morali odločiti za primerno merilno napravo. Če bi imeli na voljo le merilno napravo, ki meri dolžino v centimetrih, bi lahko izmerili oz. ocenili dolžino v milimetrih le približno, bolj “na grobo”. Taka ocena bo približna in do določene mere uporabna, a v primerjavi z bolj natančnim merilom napačna. 

Za izračun ocen prekuženosti moramo razumeti povezavo med lastnostmi testa in razširjenostjo bolezni v populaciji. Pri zasnovi in interpretaciji rezultatov seroloških testiranj se je smiselno ozreti po obstoječih modelih razširjenosti okužb v populaciji v času pandemije, ki na ravni Slovenije ocenjujejo stopnjo razširjenosti med 0,4 in tremi odstotki prebivalstva.  

Poleg zgoraj opisanih matematičnih korekcij za specifičnost in občutljivost uporabljenega serološkega testa, pa nekateri prispevki svetujejo tudi ponovno opravljanje testa na seropozitivnih primerih. V nedavnem prispevku za The Conversation angleški biolog Christian Yates napravi zelo preprosto ponazoritev, kjer pokaže, kako lahko na tak način dosežemo drastične popravke v zanesljivosti testa. Pri tem je seveda potrebno upoštevati značilnosti začetnega in ponovljenega testa, morebitno odvisnost uporabljenih testov in probleme vzorčenja. Avstrijska študija ugotavljanja prekuženosti COVID-19 (ki jo je v nedavnem spletnem predavanju predstavila Marlene Weinauer) je tako v ta namen uporabila nevtralizacijske teste. Ob tem literatura svetuje tudi druge matematične korekcije na temelju metode največjega verjetja, postavljanja mej in post-hoc korekcij.

SKLEP

Iz prikazanega torej sledi, da lahko zelo majhne razlike v specifičnosti in občutljivosti testov močno vplivajo na rezultate, lahko pa se izkaže, da dobimo ob uporabi premalo natančnih meritev tudi nesmiselne rezultate.

Dokler ne poznamo dejanske vrednosti specifičnosti in občutljivosti uporabljenih testov, ne moremo z gotovostjo trditi, kolikšna je stopnja prekuženosti populacije v Sloveniji.

Manjša kot je, večja je lahko napaka v opravljenem testiranju. Dostopni podatki o uporabljenih testih vlivajo dvom o njihovi zanesljivosti. Čas bi bil, da raziskovalci širši javnosti predstavijo podrobnejše značilnosti predstavljene raziskave, predvsem validacijo testov z oceno občutljivosti in specifičnosti testa, sicer lahko posredovani podatki še naprej sprožajo najrazličnejše interpretacije. Ocenjeno število več kot 60.000 prekuženih prebivalcev in prebivalk Slovenije se lahko ob podrobni analizi rezultatov tudi več kot prepolovi. 

Zarja Muršič in Andrej Srakar

_________

Za vse pogovore, pomoč in predloge ob pisanju prispevka se avtorica in avtor zahvaljujeva članicam in članom Sledilnika.

 

SLOVAR:

Prekuženost je opredeljena kot število ljudi, ki so že preboleli COVID-19. Prekuženost v primeru testiranja za pristnost protiteles za virus SARS-CoV-2 ne pomeni nujno (dolgotrajne) imunosti. 

Serološki test je laboratorijski preizkus, praviloma namenjen ugotavljanju specifičnih protiteles v serumu (čistemu delu krvi po odstranitvi krvnih telesc in fibrina). Protitelesa so imunoglobulini, ki se specifično vežejo z antigenom oziroma snovjo, ki sproži imunski odziv in spodbudi njihovo sintezo. 

Nevtralizacijski testi preverjajo ali protitelesa iz pridobljenega vzorca nevtralizirajo infektivnost mikroorganizma, v našem primeru virusa, ali delovanje toksina. Kar pomeni, da ta virus ne more več povzročiti bolezni in se ne širiti.

Raziskava prekuženosti prebivalcev okrožja Santa Clara v Kaliforniji je objavljena kot pre-print. Trenutno v akademski skupnosti poteka tudi razprava o pravilnem uteževanju nereprezentativnih vzorcev, tako obstaja možnost, da se ocene iz predstavljene raziskave še spremenijo.

Verjetni interval (angl. credible interval) je interval posteriorne verjetnosti, ki ga dobimo pri uporabi metod Bayesove statistike. Gre za analog intervalom zaupanja.

 

Uporabljena koda: https://github.com/LarremoreLab/covid_serological_sampling