fbpx

Virus COVID-19 analisi dati e statistiche

Aggiornamento del 22 Maggio 2020

A causa del grave rischio sanitario connesso all'infezione da Coronavirus (COVID-19) il 31 gennaio 2020, il Consiglio dei Ministri ha dichiarato lo stato di emergenza, per la durata di sei mesi.
A scopo informativo e di prevenzione, quotidianamente alle 18:30, il Dipartimento della Protezione Civile mette a disposizione ai cittadini, con licenza CC-BY-4.0, i dati raccolti dal Ministero della Salute sulla incidenza del virus, su scala nazionale.
Le statistiche dei paesi del resto del mondo sono ricavate invece dai dati messi a disposizione dall'OMS.
Per dare il nostro contributo alla grave crisi in atto, abbiamo ritenuto utile mettere a disposizione dei cittadini le nostre elaborazioni e le nostre previsioni, sviluppate sulla base di tali dati.

Le elaborazioni vengono aggiornate giornalmente dopo le 18:00

COVID19: UN METODO PER STIMARE I CONTAGIATI

La pandemia da Covid19 che ha investito il mondo e che sta impattando in maniera devastante sull’Europa ha come denominatore comune l’incertezza delle misure del numero dei contagi e della sua relazione col numero dei decessi. La misura dei contagi è proporzionale al numero dei tamponi che il sistema sanitario è in grado di eseguire e al metodo adottato per eseguirli: solo ai sintomatici e non agli asintomatici. Da un punto di vista della misurazione sperimentale è chiaro che una campionatura in grado di coprire idealmente l’intera popolazione sarebbe l’ideale ma evidentemente impossibile da realizzare per ovvie ragioni logistiche. Nonostante la limitatezza della misura i tamponi effettuati e quelli che alla fine della pandemia risulteranno essere stati effettuati hanno comunque una copertura sufficientemente ampia in termini statistici per poter già oggi trarre conclusioni significative sull’evoluzione dei contagi. L’obiettivo finale di questo studio è fornire una trattazione matematico/statistica, basata sui dati attualizzati giornalmente, per fornire una fotografia dell’infezione dei mesi seguenti.

I DATI E LA LORO TRATTAZIONE

I dati utilizzati nello studio sono quelli pubblicati dalla protezione civile. I dati giornalieri sia dei decessi sia dei contagiati sono affetti da variabilità importanti, ovvero sono affetti da un grande errore casuale che si denota estremamente mitigato nei dati cumulati cioè gli errori si compensano sommando i dati giornalieri. Le curve che descrivono contagi e decessi sono delle curve di Gompertz. Sul sito sono mostrati i dati cumulati e le relative curve di interpolazione. Il valore delle curve per tempi lunghi fornisce il valore dei contagi e dei decessi cumulati sulla base dei dati. Questi valori sono utilizzati per le considerazioni metodologiche di questo studio. I contagi e i decessi giornalieri sono altresì rappresentati e si nota come, a causa dell’errore di cui sono affetti, siano casualmente distribuiti intorno alle curve di interpolazione le quali, in questa rappresentazione giornaliera, corrispondono alle derivate prime delle curve di interpolazione dei dati cumulati. I dati per il calcolo della mortalità sono stati ricavati dai dati regionali e non dalle statistiche nazionali in quanto l’infezione manifesta diversi tempi di sviluppo tra regioni diverse e quindi i risultati sono più coerenti se trattati regionalmente.

CONTAGIATI, TAMPONI, DECESSI E MORTALITÀ

Il numero dei contagiati rilevati attraverso i tamponi è una frazione di questi ultimi. Il numero di contagiati rilevati dipende dal numero dei tamponi effettuati e quindi non fornisce la fotografia istantanea dei contagi. Il numero dei tamponi effettuati raggiunge, nella maggior parte delle regioni, pochi punti percentuali e quindi anche la base statistica per una stima dei contagiati “istantanei” è limitata. Altro discorso vale per il numero dei decessi che, per sua natura crudo e drammatico, fornisce al contrario una situazione priva delle condizioni limitanti di cui sopra. Se si conoscesse la mortalità del virus, cioè il rapporto decessi/contagiati, si potrebbe ricavare il numero dei contagiati dal numero dei decessi. Come tristemente noto la mortalità del virus è stata oggetto di un intenso dibattito nelle ultime settimane. Sono stati dati valori che spaziano da 0.16% al 5% ove al momento la WHO riporta un valore del 3.4%. In questo studio abbiamo ricavato la mortalità italiana da COVID 19 analizzando alcune regioni: Lombardia, Lazio, Veneto, Emilia-Romagna, Piemonte, Toscana, Liguria, Marche e province autonome di Trento e Bolzano.

Come descritto in precedenza il calcolo della mortalità necessita la conoscenza del numero dei contagiati e il numero dei decessi. Il numero dei decessi può essere considerato affetto da un basso errore statistico mentre il numero dei contagi misurati è drammaticamente affetto da un errore statistico che ne impedisce l’utilizzo: usando i dati misurati si ottengono mortalità anche del 10-15% che non hanno nessuna valenza scientifica. Vista l’impossibilità di utilizzare i dati giornalieri abbiamo deciso di calcolare la mortalità sui valori asintotici ovvero come se fossimo alla fine dell’epidemia e avessimo davanti ai nostri occhi “i numeri finali” cioè i decessi totali e il numero dei contagiati totali come se avessimo fatto i tamponi all’intera popolazione. Così facendo ci si libera dagli errori statistici di cui è sono affetti i conteggi degli infetti. Il valore finale dei decessi è ottenuto interpolando i dati giornalieri e prendendo il suo valore asintotico che chiamiamo Kdec. La popolazione totale dei contagiati KTOT è stata ricavata plottando il numero dei contagiati e prendendone il valore asintotico Kcont moltiplicato per la popolazione della regione di riferimento e normalizzandolo sul valore asintotico dei tamponi. Come per i decessi e i contagiati il valore dei tamponi e stato ottenuto plottando i tamponi e prendendone il valore asintotico Ktam. In termini matematici la mortalità AIFR (Asymptotic Infection Fatality Rate) si ottiene dalla formula:

AIFR [%] = KTOT/Kdec X 100

Dove  KTOT = Kcont/Ktam X Population

 

Nella figura superiore sono raggruppati i valori ottenuti. Si nota che i valori sono fortemente oscillanti e affetti da diversi intervalli di errore da regione a regione. In ogni caso il valore della mortalità può essere compreso tra 0.5 e 2.0%. A nostro avviso vista la complessità dei dati e della loro trattazione statistica l’intervallo ottenuto ha una valenza statistica importante.

CONSEGUENZE

La domanda che ci si pone è quindi sull’utilità di questo studio. Cosa facciamo con questo risultato? La risposta risiede ancora nei numeri. Dalla mortalità infatti possiamo stimare il numero di contagiati presenti e compararlo col numero di contagiati misurati quotidianamente coi tamponi. Il numero effettivo di contagiati presenti giornalmente si ricava dal numero dei decessi diviso la mortalità.

Nella figura sotto è riportata la nuova curva dei contagiati insieme alla curva dei contagiati misurati coi tamponi.

 

 

Come si può notare le due curve seguono lo stesso andamento a campana asimmetrica ma i due massimi dei picchi sono spostati di 5 giorni. Questo spostamento non deve sorprendere perché la curva ricavata dai decessi è necessariamente spostata “in avanti nel tempo” a causa della consequenzialità degli eventi contagio-decesso. La popolazione lombarda di contagiati si attesterà intorno a 1.3 ± 0.3 milioni di persone: circa il 12% della popolazione lombarda. Lo scenario sull’evoluzione temporale dell’epidemia cambia completamente osservando la nuova curva. La coda della curva assume una valenza importante: ad esempio Il 10 Maggio (in corrispondenza della freccia) in Lombardia dovrebbero esserci circa 120 contagiati se seguiamo i contagi dai tamponi mentre in realtà ne avremmo all’incirca 5000.

CONCLUSIONI

A nostro avviso questo scenario dei contagi apre una prospettiva di maggiore consapevolezza sulla situazione in corso. Lo strumento matematico fornisce delle solide basi per le valutazioni numeriche che necessariamente saranno alla base degli interventi di contrasto all’epidemia.

Come gruppo di lavoro abbiamo fatto la scelta di fornire in maniera aperta e trasparente i risultati degli studi che inevitabilmente evolvono di giorno in giorno e ci mettiamo ovviamente a disposizione di chiunque ritenesse opportuno avvalersi delle nostre competenze matematico/statistiche.

Auspichiamo di poter fornire un contributo concreto alle autorità ed agevolare il loro compito di prendere decisioni difficili durante questa situazione di emergenza.

Statistiche Nazionali

Nuovi casi registrati per Regione

Generale cumulativo