I dati della discordia sulla pandemia in Italia.

Articolo del 21 Novembre 2020

Infuriano le polemiche intorno ai dati sulla pandemia di COVID-19. Si discute sulla loro trasparenza e il loro significato, sull’uso che ne viene fatto ora e su quello che non ne è stato fatto prima per prevenire l’attuale seconda ondata. Servono dati disaggregati che permettano proiezioni più accurate e tempestive e che siano disponibili il più ampiamente possibile.

In questi giorni il “British Medical Journal” (BMJ) ha pubblicato un articolo a firma di Marta Paterlini dal titolo “Covid:19: Italy has wasted the sacrifices of the first wave, say experts”: abbiamo buttato via i risultati che eravamo riusciti a ottenere con sacrificio nella prima ondata. L’articolo cita fra gli altri anche Alberto Mantovani, secondo cui l’Italia “non ha lavorato sulla preparazione [alla seconda ondata, NdR] abbastanza velocemente e non ha preso nota dei dati quando avrebbe dovuto e potuto farlo.” “Non c’è rispetto per i dati”, scrive su BMJ.

Ci vorrà del tempo per capire le responsabilità, più o meno consapevoli, di questa seconda ondata, per capire se era evitabile e in che modo, ma di sicuro è stato centrale il modo in cui abbiamo guardato ai dati e abbiamo compreso la gravità del rischio.

Perché è relativamente semplice capire un numero quando riguarda l’oggi: possiamo guardare fuori dalla finestra, metaforicamente, e osservare se il numero descrive ciò che stiamo vivendo. È molto più difficile invece interpretare che cosa ci dice sul nostro futuro, che ancora non osserviamo, specie alla luce del fatto che non siamo nemmeno sicuri che il dato sia davvero descrittivo, solido, completo.

Un’estate al mare, stile balneare

Nei mesi estivi in Italia si è verificato proprio questo: la situazione pareva tranquilla, la pressione sugli ospedali si era alleggerita (anche se non si erano certo svuotati), i morti erano relativamente pochi, e così i contagi giornalieri. Gli italiani erano sereni, in vacanza, nei ristoranti, nei bar, nelle discoteche, senza chiusure da una regione a un’altra. Il 15 agosto avevamo 56 persone in terapia intensiva per COVID-19, lo stesso numero del 27 febbraio, e 787 ricoverati, lo stesso numero del 2 marzo.

Da metà giugno il governo aveva eliminato quasi tutte le restrizioni, lasciando soltanto la forte raccomandazione dell’igiene delle mani e l’obbligo della mascherina vicino agli altri e in luoghi chiusi. Addirittura, fino ad agosto inoltrato in tanti sono andati in vacanza all’estero, in paesi dove il virus galoppava, come la Croazia, la Spagna e la Grecia, senza che il governo avesse messo in campo un sistema di test al rientro. Nella settimana a cavallo fra luglio e agosto si registravano 820 casi in cittadini italiani di ritorno da un viaggio all’estero. “Ma se il governo è tranquillo, significa che possiamo stare tranquilli”, si diceva in giro.

Non tutti però erano d’accordo. Nella confusione mediatica, c’è stato chi ha sempre continuato a interpretare i dati come un monito che eravamo sul filo di una lama, non certo con i piedi ben poggiati a terra.  La voce più nota in tal senso è quella di Nino Cartabellotta della Fondazione Gimbe (citato anche nell’articolo del BMJ) che da nove mesi a questa parte spiega perché un focolaio si può sviluppare da un giorno all’altro, e che “non essere come a marzo” non significava non poterlo diventare nuovamente, ma solo trovarsi nella fortunata posizione di poterlo ancora evitare.

Ci sono state persone che hanno continuato a ribadire che per ogni positivo che si riscontra deve partire un accurato contact tracing, che richiede molto sforzo ai sistemi sanitari locali, già pesantemente vessati, e che basta poco per far saltare questo delicato sistema di tracciamento. Sempre nella settimana a cavallo fra luglio e agosto (dati ISS), un nuovo caso su tre era stato trovato con il contact tracing; un altro terzo dei casi era stato rilevato perché sintomatico e l’altro terzo grazie ad attività di screening (test sierologici, tamponi).

Confronti fuorvianti e contact tracing

Quali sono i dati considerare? Lo si ripete da mesi: sono i ricoveri e le terapie intensive, non i dati assoluti del numero di contagiati, che dipendono dal numero di tamponi fatti, e quindi nemmeno la percentuale fra sintomatici e asintomatici sul totale dei casi. Osservare che “a marzo, fra i positivi, gli ospedalizzati in Lombardia erano il 62 per cento e gli isolati a casa il 37 per cento, mentre oggi gli ospedalizzati sono una piccola parte” non ha alcun senso statistico.

Il numero di tamponi eseguito oggi è enormemente maggiore rispetto alla primavera: a marzo-aprile se ne facevano nell’ordine dei 10.000-20.000 al giorno, oggi nell’ordine dei 100.000-200.000 al giorno, che permette di rintracciare più positivi asintomatici che quindi possono rimanere a casa. Il problema è che nelle ultime settimane il sistema di contact tracing ha iniziato a fare acqua da tutte le parti: facendo tanti più tamponi e rintracciando tanti più positivi, è evidente che con le medesime risorse della primavera non si riescono a contattare i contatti stretti di tutti i positivi e ad assicurare a ognuno un tampone o per lo meno un monitoraggio.

Un mese e mezzo fa potevamo prevedere che le cose si sarebbero messe male? Tanti ritengono di sì: gli stessi esperti che non hanno mai smesso di chiedere al governo e ai cittadini di non abbassare la guardia, specie alla luce di una pandemia in costante crescita al di là delle nostre frontiere anche durante i mesi estivi.

Il giorno 8 ottobre 2020, chi scrive aveva fatto qualche conto della serva. Dal 5 settembre al 4 ottobre abbiamo avuto 50.658 nuovi casi in Italia (sommando tutti i nuovi casi giornalieri), mentre dal 1 al 31 luglio i nuovi casi erano stati 7006 in tutto. Una crescita notevole. Dal 5 settembre al 7 ottobre i pazienti COVID-19 in terapia intensiva erano passati da 121 a 337, mentre a luglio da 87 a 41. I ricoverati nel mese dal 5 settembre al 7 ottobre erano raddoppiati, passando da 1620 a 3782, mentre a luglio si passava da 1025 a 716 ricoveri totali.

Da quell’8 ottobre sembra passato molto tempo, perché sono successe tante cose. Siamo ripiombati in una seconda ondata, forse più pesante della prima, perché siamo tutti più stanchi e ansiosi di capire se stiamo ancora navigando a vista o se abbiamo capito come calcolare davvero questo rischio.

Indicatori troppo lenti
Il 9 novembre il Ministero della salute ha pubblicato il Monitoraggio Fase 2 Report settimanale (periodo 26 ottobre-1 novembre), con i dati dei 21 indicatori regione per regione. Se l’idea era quella di condividere le scelte con i cittadini, il risultato è un documento molto complesso, comprensibile solo agli addetti ai lavori, fra numeri non spiegati e algoritmi contenuti in altri documenti pubblicati in precedenza.

I 21 indicatori sono stati resi pubblici e il razionale del documento è chiaro e matematicamente condivisibile, ma poco conta: in dieci giorni appena dalla prima conferenza stampa del presidente del consiglio Giuseppe Conte, l’Italia ha cambiato colore più volte, e ci sono regioni passate direttamente dal giallo al rosso. Inoltre, non sono stati resi pubblici i dati che vengono usati per stimare il rischio di una regione di finire in zona arancione e rossa.

“Il sistema dei 21 indicatori è uno strumento di monitoraggio epidemiologico costruito nella fase di discesa della curva, ma non è uno strumento predittivo adeguato in questa fase di crescita esponenziale dei contagi, saturazione degli ospedali e impennata dei decessi”, spiega Nino Cartabellotta. È un calcolo complesso, soggetto a numerosi “passaggi” istituzionali, risente di varie stratificazioni normative, attribuisce un ruolo preponderante all’indice Rt e, soprattutto, fotografa un quadro relativo a 2-3 settimane prima. “In questo modo restituisce un’immagine tanto più sfuocata quanto più velocemente sale la curva” continua Cartabellotta. “Oggi serve un sistema capace di misurare rapidamente l’evoluzione del quadro epidemico, il sovraccarico dei servizi ospedalieri e, soprattutto, indicatori con un ruolo predittivo ad almeno 1-2 settimane, al fine di anticipare la corsa del virus.”

Un indice imperfetto
Anche l’indice Rnon è perfetto. “L’elaborazione di Rt ha un ritardo di almeno 3 settimane e non è utile come strumento decisionale in tempo reale”, spiega Cartabellotta. “Anzitutto, essendo stimato sui contagi di un paio di settimane prima, è inappropriato per informare decisioni rapide; in secondo luogo, il fatto che sia calcolato solo sui casi sintomatici sottostima la reale circolazione del virus perché i contagiati sintomatici oggi sono circa 1/3 dei casi totali. Terzo, Rt si basa sulla data inizio sintomi, indicatore che molte regioni non comunicano per tutti i casi e risulta in progressivo peggioramento per il sovraccarico dei sistemi di testing, determinando un’ulteriore sottostima dell’indice Rt; infine, se nella comunicazione pubblica viene correttamente citato il valore puntuale dell’indice Rt, il parametro decisionale è costituito dal margine inferiore del limite di confidenza, ovvero il valore più ottimistico.”

Va evidenziato anche che al momento circolano due stime di Rt: quella contenuta nel rapporto settimanale della sorveglianza integrata dell’Istituto superiore di sanità, diffusa tramite i mezzi di comunicazione, stimata sui casi sintomatici a 14 giorni e di cui conosciamo il metodo di calcolo; e l’indicatore 3.2. del DM 30 aprile 2020, usato per assegnare lo scenario ai sensi del DPCM 3 novembre 2020, di cui non è noto il metodo di calcolo, ma sappiamo che è stimato agli ultimi 7 giorni su casi sintomatici e sulle ospedalizzazioni.

Una condivisione opaca
Che cosa dice tutto questo ai cittadini? Che forse il rischio non è ancora ben calcolato. A marzo ci siamo trovati gettati in una situazione mai vista, una sfida incredibile per un sistema paese, anche in relazione alla condivisione dei dati pubblici. All’inizio di marzo la situazione era caotica: alcune regioni condividevano con i cittadini (e i giornalisti) alcuni dati, altre dati diversi; alcune, come il Veneto, hanno iniziato da subito a condividere i dati sulle situazioni dei singoli ospedali, mentre in molti altri casi per avere quelle informazioni si sono dovute attendere molte settimane.

Fra marzo e aprile la Protezione Civile ha creato un profilo sulla piattaforma GitHub dove ha iniziato a condividere i dati di contagi, ricoveri e terapie intensive per provincia, ed è stato un bel passo in avanti. Periodicamente l’ISS ha condiviso documenti con i dati dei monitoraggi che venivano effettuati. Ma non è sufficiente. Per affrontare una seconda ondata, una nuova chiusura, il “fidatevi di noi” ai cittadini non basta più. Sono passati molti mesi di sacrifici e ora i cittadini (e i giornalisti che si occupano di dati) chiedono di vedere i dati sulla cui base è calcolato il rischio.

Per questo il gruppo di civic hackers OnData ha lanciato una petizione DatiBeneComune per chiedere di rendere disponibili, aperti, interoperabili (machine readable) e disaggregati tutti i dati comunicati dalle regioni al governo dall’inizio dell’epidemia per monitorare e classificare il rischio epidemico, compresi tutti gli indicatori di processo sulla capacità di monitoraggio, di accertamento e quelli di risultato.

L’accordo ISS-Lincei e la lenta marcia verso dati aperti
Qualche giorno fa, l’Istituto superiore di sanità (ISS) e l’Accademia dei Lincei hanno siglato un accordo formale che prevede che l’ISS “metterà a disposizione degli esperti del’Accademia i dati raccolti, e i ricercatori dei due enti collaboreranno per le analisi di vari aspetti epidemiologici”, come recita un comunicato.

Si potrebbe osservare che si tratta di un passo nella direzione opposta rispetto alla condivisione dei dati con la cittadinanza: perché scegliere di condividere i dati solo con l’Accademia dei Lincei? E perché proprio con questa istituzione? Domande lecite, ma a ben vedere forse è il passo più rapido possibile che ci possiamo permettere ora per iniziare a vedere da vicino qualche dato.

“La situazione è complessa. Anche noi dell’Accademia dei Lincei non sappiamo che dati ha l’ISS, e in che formato e quanto questi dati siano al momento standardizzabili. Siamo ancora in una fase in cui bisogna capire i dati che ci sono, come sono raccolti e se sono pronti per essere condivisi.” A parlare è Giorgio Parisi, presidente dell’Accademia dei Lincei. “La prima cosa che faremo è chiedere all’ISS di compilare una lista dei dati che ci sono e quali sono i vincoli di confidenzialità per ogni tipo di dato. È chiaro” precisa Parisi, “che se il dato è in forma di fotocopie di cartella clinica, non è pronto per essere diffuso e per questo l’accordo formale ha implicato il coinvolgimento del Garante della Privacy”.

Qualche esempio di dato che ci piacerebbe vedere: anzitutto, quante persone (COVID-19 e non) sono ricoverate giornalmente nelle terapie intensive e negli altri reparti, poiché a oggi abbiamo solo il numero di positivi COVID-19 ricoverati. Si tenga presenteche che prima della pandemia le terapie intensive erano già piene circa all’80 per cento.

“Sarà importante anche sapere quante persone sono morte ogni giorno” continua il presidente dei Lincei, “visto che al momento abbiamo il dato sulle morti per COVID-19 comunicate in un certo giorno alla Protezione civile, ma non significa che si tratti di persone morte il giorno precedente. In molti casi i decessi sono comunicati con giorni di ritardo.” Infine, un altro esempio di dato che non è stato pubblicamente condiviso sono le analisi dei morti per classe di età negli ultimi 30 giorni: abbiamo solo il numero cumulativo dall’inizio della pandemia.

“Anche se l’ideale sarebbe avere dati completamente open” conclude Parisi, “vista la complessa situazione attuale, la condivisione dei dati con istituzioni quali i Lincei e spero a brevissimo INFN e CNR, è un primo passo importante per aprire l’attuale segretezza dei dati.”

 

FonteLe Scienze

LEGGI TUTTE LE ALTRE NEWS