Coronavirus, l’analisi dei dati  «Il numero dei positivi  non è significativo»
Marco Farina, fondatore di Data4Covid19

Coronavirus, l’analisi dei dati

«Il numero dei positivi

non è significativo»

L’intervista a Marco Farina, ingegnere informatico, Ceo della Logol Ag, promotore del progetto Data4Covid19.com per studiare il coronavirus

Marco Farina, origini comasche, Ceo di Logol AG, società svizzera specializzata in analisi dei dati ed intelligenza artificiale, ha creato Data4Covid19. com, un progetto no-profit che ha l’obiettivo di sensibilizzare le persone sull’andamento del coronavirus all’interno della Svizzera e dell’Italia, attraverso l’utilizzo dei dati.

Quali dati prendete in considerazione per studiare l’evoluzione dell’epidemia?

I dati che utilizziamo per le nostre analisi e i nostri modelli provengono da basi dati pubbliche e ufficiali messe a disposizione da diversi enti/istituzioni nei diversi paesi. Alcune di queste necessitano di un lavoro di omogeneizzazione e organizzazione del dato al fine di ottenere analisi matematiche e statistiche rilevanti. Ad esempio, per l’Italia utilizziamo i dati ufficiali messi a disposizione dalla Protezione Civile, per la Svizzera utilizziamo i dati provenienti dal Federal Office of Public Health FOPH e per la Francia quelli del Ministère des Solidarités et de la Santé, mentre altri paesi stanno per essere aggiunti al progetto.

Questa pandemia ci insegna che è necessario definire degli standard internazionali, non solo di raccolta del dato, ma anche di strutturazione e pubblicazione dello stesso, al fine di consentire dei raffronti statistici tra i differenti paesi che altrimenti rischiano di essere assolutamente insignificanti.

Perché i dati relativi ai contagi sono poco significativi dal punto di vista statistico?

In Lombardia il numero di tamponi effettuati è poco superiore al doppio dei pazienti riscontrati positivi; considerando che spesso vengono effettuati due tamponi per persona (per aumentare l’affidabilità dell’esame) significa che sono utilizzati solo per certificare la malattia in atto e non per scoprirla. Osservando le statistiche dei paesi che hanno svolto delle indagini capillari, sappiamo che meno del 20% di chi contrae il virus manifesta sintomi significativi, quindi è possibile che migliaia di persone siano state contagiate, ma sfuggano dalle statistiche ufficiali. Per questo motivo utilizziamo questo indicatore a solo fine informativo, ma non basiamo alcun modello previsionale su questo dato, piuttosto lo deriviamo.

Perché è sbagliato il concetto di picco dei contagi?

Il picco dei contagi come viene oggi raccontato dai media rischia di essere fuorviante. Mi spiego, se cerchiamo di collassare questa rappresentazione in un unico dato siamo costretti a fare un’aggregazione dei vari trend che sono in atto in Italia. Questi trend sono per loro natura disomogenei e sfasati temporalmente, aggregarli per ottenere un unico valore di picco rischia di essere poco utile per prendere qualsiasi decisione strategica.

Quello che ci aspettiamo è una “clusterizzazione” delle aree con picchi relativi, non è comunque scontato che ad un picco segua una decrescita costante dei contagi, un rilassamento delle misure di contenimento potrebbe portare a una riattivazione dei contagi, anche se siamo convinti che un tetto all’espansione della malattia sia comunque dato dall’elevata diffusione del virus.

È possibile stimare il numero dei positivi reali?

Dalle statistiche effettuate in tutto il mondo, sappiamo che la mortalità di questo virus rientra nell’intervallo 1% - 3%, considerando il numero di decessi riscontrato in Italia si può dunque derivare il numero reale di pazienti positivi che verosimilmente sarà tra 3 e 10 volte superiore al numero di positivi ufficialmente dichiarato. Purtroppo, negli ultimi giorni è emerso che nemmeno il numero ufficiale di decessi causati dal Covid19 è affidabile, esistono decessi che avvengono nelle mura domestiche ancora prima che i pazienti possano raggiungere le strutture ospedaliere e quindi non vengono intercettati dalle statistiche. Alcune analisi che stiamo conducendo, analizzando i decessi medi per comune avvenuti negli anni precedenti, ci indicano che questi decessi “silenti”, dovuti a Covid-19, possano essere in alcuni casi anche 3 o 4 volte superiori ai dati che abbiamo. Ovviamente non siamo sicuri che tutti questi decessi “silenti” avvengano a causa del Covid-19, potrebbero anche essere dovuti all’impossibilità delle strutture sanitarie, messe sotto pressione, di gestire altre patologie gravi, quello che è certo è che sono un effetto diretto o indiretto dell’epidemia.

È dunque possibile che il numero di contagiati sia persino superiore e potrebbe essere anche 20 volte o più il numero ufficiale.

L’epidemia, in particolare in Lombardia, è in fase di regressione?

Non crediamo sia corretto parlare di regressione, il valore di contagiati totale è fortemente influenzato dall’andamento nelle aree più colpite (a causa dell’andamento del fenomeno a struttura esponenziale), e l’unico motivo per cui le aree più colpite stanno rallentando è che probabilmente l’epidemia ha raggiunto la maggioranza della popolazione e non rimane più nessuno da contagiare. A titolo di esempio, a Bergamo ci sono stati quasi 1.000 decessi che, considerando livelli di mortalità realistici e il tempo medio di durata della malattia, implicherebbero che due settimane fa circa la metà della popolazione fosse già contagiata.

Qual è la possibile evoluzione dell’epidemia?

Non è facile rispondere a questa domanda, come matematici e ingegneri quello a cui stiamo lavorando è un piano con diversi scenari di probabilità che andiamo ad aggiornare quotidianamente con le informazioni che ci vengono messe a disposizione. L’obiettivo è capire nel breve periodo quale sarà lo scenario più probabile e adattare le misure di conseguenza. Ad oggi gli scenari sui quali ci stiamo focalizzando maggiormente sono sostanzialmente due, il primo che vede un’attenuazione della epidemia prima dell’estate e un secondo che invece la vede dilatarsi in autunno. Quello a cui stiamo inoltre iniziando a lavorare è un modello per cercare di comprendere come gli aiuti economici possano positivamente impattare la ripresa, cercando di massimizzare il numero di aziende che potranno tornare ad essere competitive. Non dimentichiamoci che questa crisi non è e non sarà solo sanitaria, ma avrà anche forti impatti socioeconomici e culturali.

Il lock-down (lo stop a tutte le attività) ha avuto degli effetti concreti?

È ancora presto per poter fare delle valutazioni affidabili in merito, quel che sappiamo è che nei paesi dove il virus ha avuto minore impatto, le misure cardine per il contenimento hanno incluso il tracciamento delle persone potenzialmente positive e un uso estensivo di test di positività. L’Italia per il momento ha deciso di non adottare queste due misure e ciò rischia di rendere meno efficace il sacrificio collettivo di queste settimane.

È possibile fare un raffronto con l’evoluzione della malattia in Cina?

Al momento è possibile comparare solo i numeri ufficiali, e questi sappiamo essere poco affidabili su entrambi i fronti. A titolo di esempio, a Wuhan, a fronte dei 2.500 decessi ufficiali, secondo i media è stata avviata la riconsegna ai familiari di oltre 40.000 urne funebri. Di fronte a discordanze così significative, è difficile effettuare confronti rilevanti. Se l’andamento del contagio reale in Cina avesse perlomeno la stessa struttura di quello ufficialmente comunicato (e in parte deve essere così se non altro perché sappiamo per certo quando è iniziato e quando è finito il coprifuoco nelle varie aree), potremmo dedurre alcune importanti informazioni sui segnali predittivi della fine della crisi. Purtroppo, questi segnali, visibili in modo esplicito nella curva cinese a due settimane dall’inizio del lock-down, non sono ancora altrettanto visibili nella curva italiana.


© RIPRODUZIONE RISERVATA