NUMERI COVID ITALIA/ “I veri contagi sono 6 milioni ma la letalità è molto bassa”

Salgono i contagi da Covid ma la situazione non è paragonabile a quella della primavera scorsa. Lo statistico: “I dati di cui disponiamo non sono attendibili”

Mentre i contagi da Covid-19 in Italia continuano a salire (3.678 nuovi casi, mille più di ieri, 31 morti, 1.204 dimessi/guariti, 18 in terapia intensiva, con 125.314 tamponi fatti, +25.572 rispetto a ieri), ci s’interroga intorno alla possibilità di fare previsioni statistiche su quello che sarà l’andamento delle prossime settimane e dei prossimi mesi. Ne abbiamo parlato con Giuseppe Arbia, professore ordinario di statistica economica all’Università Cattolica di Milano. Risulta che è totalmente fuorviante paragonare i datti di oggi con quelli della primavera scorsa, perché il criterio di raccolta dei dati è completamente diverso. Non solo. Secondo il professore, che con un gruppo di colleghi ha messo a punto un metodo statistico alternativo, “il numero di persone infettate in Italia si aggira intorno ai 6 milioni”. Un numero solo apparentemente drammatico, se paragonato ai 334mila della protezione civile; ma che risulta confortante perché abbatte drasticamente la letalità (rapporto malati/morti) del Covid.

Professore, è possibile paragonare l’andamento dei contagi della primavera scorsa con l’andamento di oggi, in cui la tendenza dei numeri è a salire?

Se parliamo di contagi, questo paragone con i numeri ora a disposizione non possiamo farlo, per una serie di motivi. Anzitutto il criterio di raccolta è cambiato tantissimo. Al sorgere dell’epidemia si seguiva il criterio indicato dalla Oms, cioè si testava col tampone chi presentava tre sintomi, quindi quello che andavamo a osservare non era un campione statistico della popolazione, ma solo un sottoinsieme di individui prevalentemente sintomatici. Oggi il criterio è cambiato, facciamo il tampone anche se l’individuo è asintomatico, ad esempio lo facciamo a chi è entrato in contatto con un positivo.

Un altro motivo?

La seconda ragione è che oggi si fanno molto più tamponi: mentre prima erano nell’ordine di una decina di migliaia al giorno, oggi facciamo ogni giorno 100-120mila tamponi. Qui la soluzione potrebbe sembrare semplice: fare il rapporto fra il numero dei tamponi e il numero dei positivi e andare a fare il confronto.

Appunto. E invece?

Anche questo però non è possibile: in primo luogo, per la ragione di cui ho detto prima. In secondo luogo, perché il numero di tamponi che viene reso pubblico non corrisponde al numero di soggetti sottoposti a tampone, in quanto lo stesso soggetto può essere sottoposto a tampone più di una volta. Nel corso dello sviluppo dell’epidemia il dato dell’asintomatico o del paucosintomatico sfuggiva completamente, mentre adesso riusciamo a catturarne qualcuno. Anche i tamponi odierni però non possono essere considerati campioni statistici su cui andare a operare generalizzazioni. La mia risposta in definitiva è questa: sulla base degli infetti non possiamo fare un confronto fra la primavera e oggi.

Dunque il dato di raccolta è cambiato e non ci permette di fare questo confronto in modo lineare?

Esatto. Sul Sussidiario qualche tempo fa ho scritto un articolo in cui dicevo che un bravo statistico è come un bravo cuoco, deve avere a disposizione due cose: una buona ricetta e dei buoni ingredienti. Attualmente non abbiamo a disposizione buoni ingredienti. O dobbiamo procurarceli o dobbiamo cambiare ricetta.

Fuor di metafora?

Se vogliamo monitorare questa epidemia abbiamo due strade a disposizione. La prima è di raccogliere dati con un criterio statistico. Lo ha tentato l’Istat, ma non ci è riuscito per due motivi: primo, perché l’Indagine sulla sieroprevalenza (l’Istat l’ha fatta con molta cura, come è solito fare), era una fotografia statica, e non consente dunque di monitorare lo sviluppo; secondo, perché la partecipazione all’indagine era volontaria e su 150mila programmati hanno risposto solo in circa 64.660. È facile congetturare che quei 90mila individui circa che non hanno risposto fossero prevalentemente asintomatici, persone che temevano di risultare positive, ancorché asintomatiche, e per tale motivo avrebbero dovuto rinunciare alle ferie o a lavori saltuari. Il numero dei sintomatici stimato dall’Istat nell’indagine sulla sieroprevalenza è quindi viziato da un’elevata autoselezione e quindi anch’esso poco affidabile per stimare il numero reale dei contagiati. Attualmente le persone contagiate nel corso dell’epidemia secondo i dati della protezione civile sono 333.940. Secondo l’indagine sierologica dell’Istat sono 1.482.000.

E la seconda strada? Dove porta?

Con alcuni miei colleghi abbiamo messo a punto una “ricetta” alternativa – un metodo statistico alternativo, validato da una rivista internazionale – in base alla quale stimiamo il numero di persone infettate in Italia intorno ai 6 milioni. Questo dato è peraltro in linea con quanto affermato due giorni fa da Mike Ryan, il massimo esperto di emergenza dell’Organizzazione mondiale della sanità (Oms) secondo il quale nel mondo i contagiati sono il 10% della popolazione.

Un dato, quello del numero di contagiati, che ha delle conseguenze notevoli, per diverse ragioni…

Sono due le ragioni per cui noi dobbiamo sapere chi è entrato in contatto con la malattia: la prima è che se sono di più di quelli che pensiamo, allora vuol dire che il virus si diffonde più facilmente e non dobbiamo abbassare la guardia, e questa è la notizia cattiva.

E quella buona?

È che in questo caso la letalità del virus sarebbe minore di quella che pensiamo. Per letalità intendiamo il rapporto tra il numero di morti e il numero di persone che hanno contratto il virus. Questa credo che sia l’informazione che in assoluto interessa di più alle persone: se io prendo il virus cosa rischio? con che probabilità muoio? Se la letalità è il rapporto tra il numero dei malati e il numero dei morti e se il numero dei malati è molto più alto di quello che pensiamo, significa che la letalità è molto più bassa.

Dunque tutto il problema è nei dati “giusti”, in questo caso nel numero dei malati.

sì. La soluzione, per noi statistici, sarebbe o adottare “ricette” diverse o darci da fare per ottenere “ingredienti” migliori. Già la primavera scorsa, con altri illustri colleghi (due dei quali sono anche due ex presidenti Istat: i proff. Alleva e Zuliani), abbiamo presentato un progetto per un’analisi campionaria continuativa con finalità puramente statistiche. Nelle nostre intenzioni questa analisi avrebbe dovuto essere replicata settimanalmente e non avrebbe implicato un grosso sforzo numerico: con un paio di migliaia di tamponi a settimana (però selezionati con un criterio statistico e non di convenienza), si potrebbe riuscire a rispondere in maniera più tempestiva a questa domanda: qual è la letalità del virus e come sta evolvendo nel tempo?

Coi dati a disposizione adesso invece che cosa si può fare?

Qualcosa lo possiamo fare, il bravo cuoco si adatta con gli ingredienti che ha. Possiamo guardare a due dati che sono obiettivi: i ricoverati in terapia intensiva e i decessi. Sui secondi qualcuno potrebbe obiettare che la classificazione del decesso può essere più o meno precisa, c’è questa distinzione (che è un po’ una distinzione di lana caprina) fra il morto di Covid e il morto con Covid: in entrambi i casi, però, la causa prossima del decesso è comunque il Covid. Men che meno può essere contestata l’oggettività del dato relativo alla terapia intensiva. Qui possiamo fare un confronto fra quello che succedeva in primavera e quello che succede oggi: i numeri oggi sono molto più bassi e il tasso di crescita è molto più lento che allora. Ogni tanto sentiamo parlare di mortalità del virus, ma non possiamo calcolare la mortalità del virus, perché la mortalità si potrà calcolare quando sarà tutto finito. Se avessimo i dati giusti potremmo invece calcolarne la letalità, che come dicevo è il rapporto fra numero di infetti e numero di morti.

Rispetto all’estate si riesce a registrare la variazione in modo più preciso?

Parlando di terapia intensiva e numero di morti, sì. Rispetto all’estate il numero dei morti sta crescendo, siamo passati da un numero prossimo a zero a qualche decina, e anche il numero dei ricoverati in terapia intensiva sta crescendo. Insomma, siamo oggi in una situazione intermedia fra la situazione drammatica della primavera e quella idilliaca dell’estate, ma non possiamo dire molto di più. Noi statistici osserviamo gli effetti, non riusciamo come il medico a studiare le cause, ma c’è da dire che proprio a distanza di qualche settimana dal rientro delle vacanze si è iniziato a registrare un cambiamento di tendenza con una lenta ricrescita. Un’altra causa che si va ad aggiungere a quella del ritorno dalle vacanze è il rientro a scuola.

Di quali dati avreste bisogno?

A noi servirebbe il dato individuale, seguire il percorso di ciascun individuo o di un campione di individui per vedere se l’individuo nel corso del tragitto malauguratamente si infetta, con che probabilità va in terapia intensiva, con quale muore e cosa ha fatto, le concause: se è andato a scuola, in vacanza, chi ha incontrato. Non abbiamo questi dati per diversi elementi ostativi, principalmente burocratici o di confidenzialità. A noi non interessa il nome e cognome della persona, ma il dato aggregato, la privacy sarebbe comunque rispettata.

Volendo guardare al futuro, ci sono gli strumenti per dire se l’impennata dei contagi che è stata registrata è destinata a stabilizzarsi e quindi a restare sui numeri attuali o se invece è destinata ad aumentare ancora?

Con i dati a disposizione, come dicevo, non siamo in grado di stimare il numero di infetti. Quello che siamo stati in grado di fare in passato e che saremo in grado ancora di fare in futuro è prevedere dei punti di svolta: il picco dei casi giornalieri e il picco dei casi totali. Ponendo che i numeri di cui disponiamo attualmente siano affidabili – io non ci credo e non ci può credere nessuno –, il picco dei casi giornalieri è il momento in cui iniziano a diminuire non i casi totali, ma i casi che registriamo ogni giorno.

Per quanto riguarda i tamponi?

Sui dati rilevati dai tamponi dovremmo aggiungere qualcosa che è forse nell’ordine di dieci o venti volte tanto, gli asintomatici, però il punto di svolta della curva epidemica non è sbagliato pensare che sia lo stesso (con o senza gli asintomatici) e possiamo provare a prevederlo. Noi come gruppo di ricerca (CoVstat_IT) in passato lo abbiamo fatto, abbiamo previsto che il picco sarebbe stato fra l’11 e il 17 aprile (e il risultato fu presentato alla trasmissione Dimartedì su La7).

In effetti il 17 cominciò a calare il numero dei nuovi contagi giornalieri…

È così. Ma a chi mi chiedeva all’epoca quando ci sarebbe stato un numero di casi zero ho sempre risposto che non ero in grado di prevederlo, perché i casi zero dovrebbero contenere anche quegli asintomatici che non eravamo (e non siamo) in grado di dimostrare. Qualcuno si era avventurato in queste previsioni e ha fallito clamorosamente. All’epoca però il nostro lavoro era più semplice perché ci trovavamo in una situazione assolutamente congelata, in lockdown totale, osservavamo dei valori che ugualmente non erano veri, ma almeno i valori reali erano proporzionali a quelli che osservavamo.

Oggi, al contrario, abbiamo una situazione mobile, imprevedibile.

Esatto, c’è la massima mobilità, dobbiamo riassorbire i due fattori di cui abbiamo parlato prima (la fine vacanze e l’inizio delle scuole), stiamo aspettando un momento in cui possiamo considerare che questi due fenomeni scatenanti abbiano esaurito la loro spinta per trovarci in una situazione in cui sia possibile prevedere il punto di svolta. Abbiamo osservato dei fattori perturbanti piuttosto evidenti, che ormai hanno quasi esaurito la loro spinta, la scuola è iniziata da tre settimane, la fine delle vacanze è ormai lontana nel tempo, quei fattori non ci sono più. Rimane una grande mobilità generale: le persone prendono i mezzi, vanno in ufficio. Noi costruiamo un modello statistico che fa una fotografia dell’esistente e tenta di proiettare la dinamica, se nel modello statistico intervengono fattori estranei il modello salta, quindi il modello di oggi non sarebbe lo stesso di marzo, sarebbe un modello che dovrebbe tenere conto anche della mobilità e può in effetti tenerne conto, a condizione che la mobilità sia costante. Se invece, per qualche fattore, quella mobilità venisse congelata o al contrario accelerata, cambierebbero di nuovo le condizioni e i modelli fallirebbero.

Non riusciamo, al momento, a dare altri punti fermi?

Posso arrivare a dire che probabilmente fra un paio di settimane potremmo avere gli elementi per fare una nuova previsione.