Covid-19: comprendere cos'è un test diagnostico

Categoria: Frontpage sample category Creato: Domenica, 19 Aprile 2020 Ultima modifica: Giovedì, 30 Aprile 2020 Pubblicato: Domenica, 19 Aprile 2020 Scritto da Danilo D'Amico Stampa Email
Covid-19
 Learning to fly 
Come siamo stati fortunati a non avere questi test sugli animali negli anni '40, perché probabilmente la penicillina non avrebbe ottenuto una licenza e forse l'intera gamma degli antibiotici non sarebbe mai stata realizzata.
Alexander Fleming
 
Molte persone credono che un test diagnostico in medicina sia un elemento di certezza, che sia in grado di discriminare perfettamente due popolazioni non sovrapponibili, che − in buona sostanza − sia in grado di dividere i sani dai malati. Le cose sono in realtà più complicate.
Gli innumerevoli test disponibili in medicina possono essere suddivisi, in base all'affidabilità dei risultati da essi forniti, in due categorie: test «patognomonici» e «non patognomonici».
 
ATTENZIONE: Questo articolo non si occupa di test diagnostici per la malattia Covid-19, ma riporta una serie di utili indicazioni per comprendere il valore informativo di un qualunque test diagnostico medico. Si tratta, dunque, di un mero intervento divulgativo di carattere generale.

* * * * * * * * * *

Un sintomo di una malattia si dice patognomonico quando indiscutibilmente serve a riconoscere la malattia; quindi è presente soltanto in pazienti affetti da quella malattia e non da altre. Il sintomo può essere patognomonico imperfetto (la sua presenza indica la certezza della malattia, ma la sua assenza non attesta l’assenza della malattia) oppure patognomonico perfetto (la sua presenza indica la certezza della malattia e la sua assenza attesta l’assenza della malattia).
Analogamente, un test patognomonico è un test che, quando fornisce esito positivo, indica con certezza la presenza del carattere ricercato.
Quasi tutti i test impiegati in medicina sono non patognomonici; in altre parole, essi - siano positivi o negativi - non forniscono un risultato certo, ma soltanto probabile. Pertanto, alcuni dei risultati positivi forniti da un test non patognomonico saranno falsi positivi, così come alcuni negativi saranno falsi negativi. Al contrario, un test patognomonico non genera mai risultati falsi positivi, ma può fornire risultati falsi negativi (se patognomonico imperfetto).
È raro trovare dei test che forniscono risultati del tipo positivo/negativo oppure sano/malato oppure si/no. Un test di questo tipo, con output binario (in due sole categorie), viene detto nominale dicotomico; si tratta di un test qualitativo in quanto misura l'esistenza (qualità) di un fenomeno e non la sua ampiezza (quantità). Più spesso troviamo test semi-quantitativi che generano risultati classificabili in più di due categorie. Ad esempio, attraverso un test si può classificare come segue lo stato di un paziente dopo un trattamento: molto peggiorato, peggiorato, stazionario, poco migliorato, migliorato, molto migliorato. Le variabili di questo tipo, costituite da dati qualitativi suddivisi in più categorie con una direzione chiaramente implicita (es. migliore→peggiore o viceversa), vengono dette ordinali.
Ancora più spesso, troviamo test quantitativi, che forniscono risultati misurabili su una scala numerica (variabili continue), come ad esempio i valori di densità ottica (D.O.) di un test ELISA misurati con lo spettrofotometro.
Per i test quantitativi (ed anche per i test semi-quantitativi), sorge un problema di interpretazione: occorre stabilire un valore critico o soglia o cut-off, che rappresenta il limite di separazione tra quella che sarà considerata la positività o la negatività del test. Ciò corrisponde generalmente alla separazione ammalato/sano.
Inoltre, la scelta del cut-off è di estrema importanza: forse ti sorprenderà apprendere che la sensibilità e la specificità di un test possono essere fatte variare a proprio, piacimento variando il cut-off.
Il test ELISA (Enzyme-Linked ImmunoSorbent Assay) è test quantitativo che impiega un enzima coniugato a un anticorpo per identificare e quantificare la presenza di anticorpi (o di antigeni) nel siero di sangue o in altri materiali. In caso di positività, l’enzima induce una variazione di colore tanto più intensa quanto più elevata è la presenza di anticorpi (o di antigeni) nel campione. La variazione di colore viene rilevata attraverso uno strumento (spettrofotometro) e si esprime con un valore numerico attraverso una unità di misura detta assorbanza (o densità ottica).
Nel seguente grafico sono riportate delle curve teoriche ottenute supponendo di saggiare con un test ELISA, sieri di sangue prelevato da un campione di soggetti sicuramente malati e da un campione di soggetti sicuramente sani. Come si vede, c’è una intersezione tra i due insiemi dei soggetti sani e dei soggetti malati.
 
NON E' UN TEST PERFETTO
Forse ti aspettavi che i sieri dei soggetti sani facessero registrare valori di densità ottica costantemente pari a zero. Oppure, ti aspettavi che i soggetti sani facessero registrare valori sempre inferiori rispetto ai malati (v. grafico a sinistra). In questi casi, il test sarebbe perfetto e infallibile, e non ci sarebbero problemi di interpretazione. Purtroppo, nella pratica ciò non si verifica, e non dobbiamo stupirci che in una certa quota di soggetti sani possa evocare una risposta positiva al test e viceversa: questo fenomeno può essere dovuto a una varietà di cause che non è possibile trattare qui.
 
Considera ora il grafico qui sotto, in cui viene scelto un cut-off = 1. Il cut-off suddivide sempre i soggetti sottoposti a test in due insiemi: test-positivi e test-negativi. Ma tale suddivisione non coincide con quella sani/malati. Infatti, fra quelli classificati come test-negativi sono compresi soggetti negativi veri, cioè sani (area verde), e soggetti negativi falsi, cioè malati (area tratteggiata viola). Analogamente, fra i test-positivi sono compresi soggetti positivi veri, cioè malati (area rosa), e soggetti positivi falsi, cioè sani (area tratteggiata gialla).
 
Riassumendo: adottando un cut-off = 1, si ottengono quattro classi di animali: (a) positivi veri, (b) positivi falsi, (c) negativi falsi, (d) negativi veri. Possiamo riportare queste quattro classi in una tabella a doppia entrata che, come vedremo più avanti, ci consentirà di comprendere meglio i concetti di sensibilità e di specificità di un test:
 

Fonte: Quaderno di epidemiologia veterinaria del prof. Ezio Bottarelli

 

È possibile scegliere valori di cut-off tali addirittura da massimizzare la sensibilità oppure la specificità come illustrato nei grafici che seguono:

Fonte: Quaderno di epidemiologia veterinaria del prof. Ezio Bottarelli

Fonte: Quaderno di epidemiologia veterinaria del prof. Ezio Bottarelli

Nel primo caso (Sensibilità = 1) il cut-off è stato abbassato a circa 0.8: sotto questa nuova ipotesi, il test riesce a individuare tutti i soggetti ammalati essendo il valore dell’area c = zero. Però, come contropartita, hai un aumento dell'area b (falsi positivi). Poiché c = 0, la sensibilità è massima, ossia è pari a 1; questo effetto favorevole è bilanciato da una diminuzione della specificità.

Nel secondo caso (Sensibilità = 1) il cut-off è stato alzato a circa 1.3: sotto questa nuova ipotesi, il test riesce a individuare tutti i soggetti sani, essendo il valore dell'area b = zero. Però, come contropartita, hai un aumento dell'area b (falsi negativi). Poiché b = 0, la specificità raggiunge il valore massimo di 1; questo effetto favorevole è bilanciato da una diminuzione della sensibilità.

In genere è conveniente scegliere un cut-off di compromesso (come nel primo grafico, con cut-off = 1), in cui sia la sensibilità che la specificità hanno un valore <1, e perciò si otterrà una quota di risultati positivi falsi e di negativi falsi. Questo inconveniente è inevitabile, e deriva dalla parziale sovrapposizione delle due curve di distribuzione (sani e malati). È quello che solitamente avviene, con i due insiemi (test-positivi e test-negativi) che si sovrappongono in parte, e con il test che identificherà come positivi alcuni soggetti non malati (Falsi Positivi) e come negativi alcuni soggetti invece malati (Falsi Negativi).

Dunque, abbiamo detto che non esistono test capaci di accertare il reale stato (malato o sano) di un soggetto in tutte le situazioni e nel 100% dei casi. In altre parole: non esistono test certi o infallibili. L’esito del test (sia esso positivo, cioè che rilevi l’esistenza della malattia, o negativo in caso contrario) deve essere visto come una indicazione di probabilità.

Abbiamo parlato di sensibilità, specificità, veri positivi, veri negativi, falsi positivi e falsi negativi.

Cerchiamo ora di focalizzare meglio tali concetti.

Partiamo dal fatto che, in generale, ogni test diagnostico presenta due coefficienti: sensibilità e specificità.

Per meglio comprendere questi concetti immaginiamo di sottoporre a test una certa parte della popolazione, che indichiamo con P, e disegniamo la seguente tabella a doppia entrata:

Fonte: Quaderno di epidemiologia veterinaria del prof. Ezio Bottarelli

Ovviamente si ha che

P = M+ ∪ M− (popolazione = insieme dei soggetti sani unito all’insieme dei soggetti malati)

P = T+ ∪ T− (popolazione = insieme dei soggetti con test negativo unito all’insieme dei soggetti con test positivo)

Le colonne della tabella rilevano la situazione reale dell’insieme P dei soggetti esaminati, i quali costituiscono un insieme formato da soggetti malati (M+) e soggetti sani (M-).

Le righe della tabella rilevano la percezione del test, costituita dall’insieme P dei soggetti esaminati, suddiviso in soggetti risultati positivi al test (T+) e soggetti risultati negativi al test (T-).

Tutti i soggetti esaminati sono stati sottoposti al test, per cui (a+c) + (b+d) = (a+b) + (c+d)

Il significato delle celle è chiaro:

  • cella “a” = soggetti T+ M+ (numero di soggetti risultati test-positivi ed effettivamente malati);
  • cella “b” = soggetti T+ M- (numero di soggetti risultati test-positivi, ma effettivamente sani);
  • cella “c” = soggetti T- M+ (numero di soggetti risultati test-negativi, ma effettivamente malati);
  • cella “d” = soggetti T- M- (numero di soggetti risultati test-negativi ed effettivamente sani).

Fonte: Quaderno di epidemiologia veterinaria del prof. Ezio Bottarelli

La sensibilità esprime la percentuale dei soggetti realmente malati che risultano positivi all’esame. Più alto è questo parametro, minore sarà il rischio di “falsi negativi”.

Nella tabella, i malati sono rappresentati da (a+c) e, fra questi, i test-positivi sono rappresentati da (a); quindi, la sensibilità si calcola con la proporzione a/(a+c)

Fonte: Quaderno di epidemiologia veterinaria del prof. Ezio Bottarelli

 

Come prima considerazione, potremmo pensare che una altissima sensibilità è l’unica qualità desiderabile in un test: infatti, il poter identificare correttamente, attraverso un test, tutti i soggetti malati è tutto quello che ti serve.

Tuttavia, se esaminiamo meglio la questione, ci rendiamo conto che le cose non stanno proprio così: un’alta sensibilità non è sufficiente. Infatti, è necessario anche un altro requisito: un buon test deve identificare come positivi soltanto i soggetti che hanno la malattia; cioè, è necessario che fra i test-positivi non siano inclusi anche soggetti sani.

Da questa osservazione discende il concetto di specificità.

Fonte: Quaderno di epidemiologia veterinaria del prof. Ezio Bottarelli

Con specificità s’intende la percentuale dei casi che risultano positivi al test e che non sono realmente affetti dalla patologia. Più alto è questo numero, minore è il rischio di “falsi positivi”.

Nella tabella i sani sono rappresentati da (b+d) e, fra questi, i test-negativi sono rappresentati da (d); quindi, la specificità si calcola con la proporzione d/(b+d):

 

Fonte: Quaderno di epidemiologia veterinaria del prof. Ezio Bottarelli

Come abbiamo visto sopra parlando del cut-off, i due parametri sono, in un certo senso, mutualmente escludenti. Un certo numero di falsi positivi e di falsi negativi sono, di fatto, ineliminabili.

Oggi, esistono molti test ed esami, che esibiscono valori di sensibilità e specificità apparentemente rassicuranti: 90, 95, 98 %

Ma è giusto sentirsi rassicurati?

Non è facile rispondere a questa domanda. Per tentare di dare una risposta dobbiamo ricorrere al

 Teorema di Bayes e probabilità condizionata

Se la probabilità del verificarsi dell’evento A) non influenza il verificarsi dell’evento B) la probabilità complessiva si ottiene come prodotto delle singole probabilità dei due eventi. Invece, qualora la probabilità del verificarsi dell’evento B) sia influenzata dal fatto che si sia già verificato l’evento A), il risultato sarà ancora un prodotto, ma non più tra le singole probabilità dei due eventi.

Con l’espressione P(B∣A) – (che si legge probabilità di B condizionata da A) − indichiamo la probabilità che si verifichi l’evento B) quando A) si è già verificato, e che può essere diversa da P(B), cioè dalla probabilità che si verifichi l’evento B) indipendentemente da A).

Per comprendere meglio il concetto di probabilità condizionata puoi trovare QUI un interessante video esplicativo, molto chiaro. Per approfondire il concetto con esempi pratici puoi cliccare QUI per un altro interessante video esplicativo, sempre molto chiaro e particolarmente utile anche per capire quanto diremo più avanti.

Torniamo ora ai test diagnostici in ambito medico: perchè ci interessa la probabilità condizionata? Perchè abbiamo visto che se siamo riusciti a costruire un test quantitativo basato sulla rilevazione di sintomi o elementi non patognomonici potremo solo affermare che chi risulta positivo al test ha una certa probabilità di essere malato e/o che chi risulta negativo al test ha una certa probabilità di non esssere malato. Abbiamo visto che queste affermazioni dipendono dal cut-off, cioè dal valore soglia che abbiamo scelto per distinguere tra "positività" e "negatività" al test (ad esempio: al di sotto di quale volume di eritrociti consideriamo un soggetto anemico? Al di sopra di quale densità ottita di un test ELISA consideriamo il test positivo?). Abbiamo anche visto che, scelto un certo valore di cut-off, potremo stimare la probabilità che il soggetto positivo al test sia malato e/o che il soggetto negativo al test sia sano. Ma queste due probabilità sono condizionate alla probabilità assoluta di essere malati (cioè alla prevalenza della malattia), a prescindere dal test. Spieghiamoci meglio.

Sappiamo che è in corso una certa malattia che interessa una certa popolazione P, per la cui rilevazione viene messo a punto un test diagnostico non patognomonico che viene effettuato su tutta la popolazione (screening di massa).

Indichiamo con

M− l’insieme dei soggetti sani

M+ l’insieme dei soggetti malati

T− l’insieme dei soggetti con test negativo

T+ l’insieme dei soggetti con test positivo

 Ovviamente si ha che

P = M− ∪ M+ (popolazione = insieme soggetti sani unito a insieme soggetti malati)

P = T− ∪ T+ (popolazione = insieme soggetti con test negativo unito a insieme soggetti con test positivo)

Poiché il test diagnostico è non patognomonico (non è perfetto) in generale avremo che T+ ≠ M+ e che T− ≠ M−

Si dice prevalenza della malattia la probabilità di essere malato:  p(M+) = M+ / P

La prevalenza è una misura di tipo statico. Si tratta quindi di una proporzione che possiamo anche esprimere come M+ / (M+ ∪ M-) dove

M+ sono i soggetti malati

M- sono i soggetti sani, ma suscettibili di contrarre la malattia (soggetti a rischio).

La prevalenza può essere determinata attraverso una indagine epidemiologica, esaminando tutti gli individui della popolazione o, più verosimilmente, un campione rappresentativo.

Se la malattia non è conosciuta, la prevalenza non è nota a priori. Ad esempio, per la malattia Covid-19 si sta tentando di stimare la sua prevalenza nelle diverse aree del pianeta in cui si è manifestata (puoi trovare un articolo concernente la stima della prevalenza cliccando QUI

Orbene, un soggetto con test positivo si chiede se ha la malattia, ovvero si chiede qual è la probabilità di avere la malattia sapendo che il suo test è positivo. Allo stesso modo un soggetto con test negativo si chiede qual è la sua probabilità di essere effettivamente sano.

Osserviamo che per entrambi i soggetti, prima di fare il test e di conoscerne l’esito, la loro probabilità di avere la malattia coincideva con quella che abbiamo chiamato prevalenza della malattia, ma ora che hanno un’informazione in più (cioè l’esito del test) tale probabilità è verosimilmente cambiata.

 Possiamo indicare come

- valore predittivo positivo del test (v.p.p.) la probabilità di avere la malattia in caso di test positivo: p(M+|T+) [che si legge probabilità di M+ condizionata da T+]

- valore predittivo negativo del test (v.p.n.) la probabilità di non avere la malattia in caso di test negativo: p(M−|T−) [che si legge probabilità di M− condizionata da T­−]

 Possiamo determinare il v.p.p. positivo applicando la formula di Bayes per le probabilità condizionate

 

dove

 p(T+|M+) = è la sensibilità del test, cioè la probabilità di avere il test positivo se si è malati;

 p(M+) = è prevalenza della malattia, cioè la probabilità di essere malato;

 p(T+) = è la probabilità di risultare positivi al test, data dalla sensibilità del test p(T+|M+) sommata alla probabilità di avere il test positivo se si è sani p(T+|M−)

La conoscenza della prevalenza della malattia può derivare dai dati epidemiologici noti, mentre la conoscenza della sensibilità e della specificità del test diagnostico derivano da studi pregressi effettuati nell’approntamento del test e nella verifica della sua affidabilità.

In assenza di tali dati, non è possibile fare un’analisi probabilistica.

Per capire meglio, svolgiamo un esempio numerico.

Nell'attuale emergenza sanitaria da Covid-19 il governo italiano ha indetto una gara per la fornitura di Kit del tipo CLIA e/o ELISA per la rilevazione di IgG specifiche (anticorpi neutralizzanti per SARS - CoV2) per l’effettuazione di 150.000 test sierologici finalizzati ad un’indagine campione sulla diffusione dell’infezione da SARS - CoV-2, richiedendo espressamente una sensibilità non inferiore al 90% ed una specificità non inferiore al 95%.

Dunque, e come abbiamo visto nell’esempio, per poter calcolare la probabilità che un soggetto risultato positivo al test diagnostico sia effettivamente malato, bisogna conoscere la probabilità a priori, ovvero quella che abbiamo chiamato

Spesso questa probabilità a priori non ha molto senso riferirla all’intera popolazione del pianeta o di uno stato, ma sembra più utile determinarla rispetto a determinato sotto-insiemi della popolazione, che possono denominarsi categorie di soggetti a rischio.

Un esempio classico riguarda un certo test per identificare l’infezione da HIV che ha una sensibilità del 99,5 % e una specificità del 98%. Per un soggetto con un test positivo qual è la probabilità che sia effettivamente malato? Per rispondere alla domanda abbiamo bisogno di alcune informazioni imprescindibili, ovvero conoscere chi è il soggetto esaminato (ad esempio un cittadino italiano che vive in Italia) e qual è la probabilità che un italiano residente, selezionato a caso tra la popolazione italiana e quindi senza comportamenti a rischio, abbia contratto l’AIDS. Chi è in grado di indicare una tale probabilità? Forse nessuno. Così ci si basa su stime, che sono inevitabilmente soggettive.

Si potrebbe, ad esempio, ritenere realistica una probabilità pari a 1/600 e calcolare il valore predittivo positivo del test (v.p.p.)

Tali risultati derivano dal fatto che il Teorema di Bayes bilancia in maniera appropriata le osservazioni (il risultato dell’analisi) con le conoscenze “a priori” del problema epidemiologico in considerazione (nel nostro caso: la 1° ipotesi di soggetto non rientrante in categorie a rischio e di bassa diffusione dell’AIDS nella popolazione italiana pari a 1/600, la 2° ipotesi di soggetto appartenente a categoria relativamente a rischio per 1/200, la 3° ipotesi di soggetto appartenente a categoria ad altissimo rischio per 1/2).

Messa in questi termini, la domanda non ha risposta univoca.

Ogni test ha senso ed è utile se e solo se sappiamo a chi viene rivolto.

In situazioni più complesse di quelle viste sopra ogni effetto può essere a sua volta causa di altri effetti, gli effetti possono essere tra loro dipendenti e così via. I software che implementano l’inferenza bayesiana sono in grado di propagare le informazioni in ogni nodo della rete utilizzando il Teorema di Bayes, ovvero di estendere a molte variabili il processo che abbiamo applicato al problema del test dell’HIV.

Si può arrivare così a costruire una rete bayesiana, che consiste di un insieme di variabili, dette nodi, che si possono trovare in un numero finito di stati mutuamente esclusivi.

Uno dei primi esempi accademici di rete bayesiana è la rete Asia, rappresentata nella figura qui sotto

La figura mostra in maniera efficace quali sono la potenzialità di una rete bayesiana. Si tratta della versione semplificata di una rete per la diagnosi di malattie ai polmoni, in particolare tubercolosi, cancro e bronchite. Ogni nodo della rete corrisponde a un comportamento del paziente o al risultato di un esame medico, mentre la direzione delle frecce descrive le relazioni tra le variabili: ad esempio essere fumatore alza la probabilità di avere un tumore ai polmoni o di soffrire di bronchite, mentre non ha alcuna relazione con la tubercolosi.

Nel momento in cui si inseriscono nella rete le informazioni sul paziente in esame (sintomi e comportamenti), queste si propagano all’interno della rete, aggiornando in maniera quantitativa le probabilità associate ai nodi non noti della rete (malattie).

Le due immagini che seguono sono l’interfaccia grafica per la rete Asia di uno dei software utilizzati per la costruzione di reti bayesiane Hugin Expert, prima e dopo che siano inserite le informazioni relative al paziente.

 

Dal confronto tra le due immagini si vede come le informazioni sui comportamenti del paziente e sui sintomi abbiano cambiato le probabilità iniziali di avere una delle tre malattie.

In data 30/03/2020, nell’emergenza sanitaria internazionale legata alla diffusione del virus SARS-CoV-2 e dell’insorgenza della malattia denominata COVID-19, l’Imperial College London, nel proprio studio denominato “Stima del numero di infezioni e dell’impatto degli interventi non farmaceutici su COVID-19 in 11 paesi europei”, ha utilizzato un modello gerarchico semi-meccanico, articolare, bayesiano, per riprodurre le tendenze osservate nei dati sui decessi attribuiti all’infezione e per fare previsioni su brevi orizzonti temporali. Secondo il modello utilizzato dall’Imperial College London, in Italia le persone cumulativamente infettate dal virus alla data del 28/03/2020 sarebbero 5,9 milioni, con un tasso d’infezione di circa il 9,8% della popolazione. In alcuni altri paesi europei i tassi d’infezione sarebbero: Spagna 15%, Francia 3,0%, Regno Unito 2,7%, Germania 0,73%.

Uno dei parametri fondamentali utilizzato nel modello è il coefficiente Rt, cioè il numero delle infezioni secondarie indotte da ogni individuo infetto, il cui valore è stato stimato per ogni paese sulla base delle misure di distanziamento sociale adottate (se Rt = 0 non c’è trasmissione del virus).

 

 

 

 

 

 

 

 

 
Visite: 962