Statistica e coronavirus: guida ai dati quotidiani

il presente contributo, che verrà seguito da altri, è compilato nella speranza di offrire semplice chiarezza e supporto ai bollettini quotidiani che accompagnano la nostra giornata. Ritengo ovvio precisare che questo articolo ed i seguenti non sostituiscono il doveroso approfondimento con riviste ed articoli di calibro scientifico.

Aprile 2020
5 Mins Read
6.1K Views
Statistica e Coronavirus: guida ai dati quotidiani per conoscere meglio le informazioni.

Statistica e Coronavirus: guida ai dati quotidiani per conoscere meglio le informazioni.

Statistica e Coronavirus è una piccola guida ai dati quotidiani che nasce da due impulsi. Uno è appunto l’amore per questa disciplina, maturato sui banchi universitari e mai abbandonato. Il secondo invece è relativo alla necessità di trasmettere, al lettore, dei precisi riferimenti per guidarlo alla comprensione dei tanti dati statistici che i mass-media ed i social network sciorinano ogni giorno.

Quest’ultima motivazione a mio parere è sia un pregio che un difetto. Il verbo sciorinare non è usato a caso. Significa “mettere in mostra”, e in questa accezione connota una mera elencazione di numeri, spesso senza fornire una spiegazione e/o interpretazione sul loro valore informativo.

Comunque, come detto, ciò conserva un determinato pregio in quanto dimostra l’accessibilità immediata delle informazioni e la loro fruibilità al grandissimo pubblico. Il difetto riscontrato invece è appunto nella lama a doppio taglio di quest’ampia disponibilità, per non dire eccessiva, di informazioni. Spesso incomprese, affrettate, distorte, vagliate con superficialità od addirittura completamente errate.

È ciò che il neologismo Treccani definisce Infodemia, che comporta fra l’altro il “difficile orientarsi su un determinato argomento per la difficoltà di individuare fonti affidabili”. Nella maggior parte dei casi addirittura, un’estemporanea e fuori luogo diffusione di informazioni è il carburante delle fake-news o notizie click-bait. Dunque, il presente contributo, è compilato nella speranza di offrire semplicemente chiarezza e supporto ai bollettini quotidiani che accompagnano la nostra giornata.

Cos’è la Statistica?

La Statistica è la disciplina della misura e raccolta, organizzazione, elaborazione, analisi, sintesi, descrizione, interpretazione e comparazione dei dati relativi a fenomeni collettivi, basata su un approccio scientifico. L’ottica adottata prevede dunque l’utilizzo di strumenti concettuali e modelli di natura matematica, da cui scaturiscono delle leggi per l’appunto definite con l’aggettivo statistiche.

Queste leggi sono applicate dagli studiosi per indagare sul comportamento di un dato fenomeno (sociale o scientifico) offerto dall’esperienza reale. Dunque, come ben sappiamo a volte anche inconsciamente, abbiamo molte occasioni per imbatterci nella Statistica. Ad esempio, quando affrontiamo argomenti relativi all’Ingegneria, alla Fisica, alla Chimica, alle Scienze Sociali, all’Economia e anche, specialmente negli ultimi mesi, alla Medicina e all’Epidemiologia.

L’importanza della Statistica nella storia.

La materia Statistica è relativamente giovane rispetto a quelle appena menzionate. Fonti autorevoli ne stabiliscono la nascita nel Seicento (le grand siècle, secondo una considerazione squisitamente francese), ma d’altro canto se ne possono riscontrare le primitive origini dall’Antichità. Il fiorire proprio nel periodo di nascita della scienza moderna comunque non permise alla Statistica di riscuotere agli inizi grandissime considerazioni. Anzi, venne addirittura additata come una scienza “povera”. Il vero e proprio riscatto avverrà agli inizi del Novecento.

Agli albori del XX secolo infatti la Statistica diventò una scienza “non soltanto sociale, perché il suo campo è molto più largo” (A. Kaufmann, 1913). La frase appena citata diede un impulso notevole alla considerazione della Statistica come campo dello scibile umano interdisciplinare.

Con lo sviluppo impetuoso della Fisica moderna, il cambio di prospettiva venne ulteriormente rafforzato. Nuove teorie all’orizzonte, anzi un completo stravolgimento della fisica classica intaccata nelle sue fondamenta attraverso due nuovi modus operandi. Parliamo della Teoria della Relatività Ristretta e della Meccanica Quantistica. Quest’ultima poi portò con sé  tante interpretazioni (vedi qui), ovvero tentativi di dare risposte sul “perché funziona così”, in cui l’approccio statistico è una componente fondamentale.

Riportiamo a questo proposito le parole del celebre fisico Max Planck (1933) (vedi qui per biografia): “In ogni legge fisica, anche nella gravitazione e nell’attrazione elettrica, c’è un nucleo di natura statistica, si tratta sempre di leggi di probabilità, basate su valori medi di numerose osservazioni dello stesso tipo e valide nei singoli casi in modo approssimato”.

La Statistica descrittiva.

Generalmente l’intera disciplina della Statistica viene suddivisa in due distinte branche, differenti per filosofia di fondo. Stiamo parlando rispettivamente della Statistica descrittiva e della Statistica inferenziale.

La Statistica descrittiva funge da metodologia di visualizzazione riassunto e sintesi dei dati preliminari osservati sul campo. Esploriamo la struttura, le caratteristiche e le anomalie dei dati stessi, attraverso una loro riduzione in volume ed estraendone informazioni in altre forme come tabelle, grafici ed indicatori numerici e sintetici. Viene facilmente in mente quindi l’importanza dei metodi descrittivi nella divulgazione verso altre persone delle conclusioni su un certo fenomeno.

Rispetto ad un semplice ammasso di numeri o nomi, gli strumenti descrittivi permettono una comunicazione più efficiente, chiara, coincisa e comprensibile degli accadimenti oggetto d’indagine. In aggiunta, comparano con criterio rigoroso due o più fenomeni simili, per dedurne punti in comune o differenze nella loro manifestazione reale. Inoltre, la Statistica descrittiva consente di verificare se un certo modello teorico costruito in precedenza si conforma ai dati sperimentali effettivamente rilevati.

La sintesi dei dati raccolti è di fondamentale importanza, poiché inevitabilmente comporta “fisiologicamente” una certa perdita di informazione. Altrettanta cura viene riposta nell’individuazione ed eliminazione, per mezzo dei metodi descrittivi, di particolari errori nella rilevazione o nella trascrizione dei dati.

Alcune precisazioni.

La Statistica descrittiva non fa differenze fra le basi di partenza dei dati. In dettaglio, non è indispensabile tener conto che i dati provengano o da tutta l’intera popolazione oggetto d’indagine oppure da un campione più o meno vasto, estratto da essa.

Comunque tendenzialmente la Statistica descrittiva utilizza una base di stampo censuario, ovvero sulla totalità di tutti i componenti di una popolazione. È opportuno specificare che per “popolazione” non si intende solo il senso di insieme di esseri umani, ma assume un carattere generale.

In Statistica ci si riferisce con il termine “popolazione” anche all’insieme di entità come oggetti (automobili, case, libri, etc…), o altri esseri viventi (animali, piante, funghi… e virus!). Importante, nella Statistica descrittiva, è anche predisporre i dati in delle forme utili ad affrontare altre metodologie di indagine. Questo obbiettivo viene raggiunto attraverso un’accurata manipolazione e modifica degli stessi, nonché la valutazione della loro qualità.

Non a caso, spesso la Statistica descrittiva viene utilizzata come ottimo punto di partenza per indagini di carattere inferenziale. Fra le principali informazioni ricavabili sulla popolazione d’indagine possiamo distinguere due vie principali. In primis le tendenze intorno ad un valor medio, oppure circa la variabilità dei caratteri della popolazione. Vedremo più avanti in dettaglio queste accezioni.

La Statistica inferenziale.

Arriviamo alla Statistica inferenziale dunque. A volte, anzi nella maggior parte dei casi, compiere un’indagine prendendo come base tutta la popolazione risulta abbastanza complesso, operativamente ed anche economicamente oneroso, oltre che temporalmente molto lungo. Dunque, viene in aiuto il concetto di campione e di campionamento. Prendendo infatti come riferimento solo una porzione estratta della popolazione, il campione per l’appunto, e studiandone le caratteristiche, possiamo estendere le conclusioni su di esso a tutta la popolazione d’origine.

Questo avviene nell’aspettativa che il comportamento del campione rappresenti in maniera più o meno fedele il comportamento della popolazione originaria, ovvero ne sia una buona stima. In altre parole, da delle informazioni basate sull’osservazione di alcuni fatti, è possibile formulare previsioni o supposizioni su altri fatti che sono rimasti incerti. Naturalmente, questa rappresentazione comporta inevitabilmente una certa soglia d’errore da tenere in considerazione.

Quindi, i risultati e le asserzioni a cui giungiamo non possono esprimere una verità assoluta. Conservano sempre un certo grado di incertezza, ma che possiamo accettare con un buon grado di fiducia. È molto palese l’interconnessione con la teoria della probabilità e inferenza statistica. L’estrazione del campione non avviene con un unico metodo, anzi ne sono previsti di molteplici, ciascuno con vario grado di complessità.

Conclusioni.

Approfondiremo più avanti, con la dovuta solerzia, ogni aspetto della Statistica affrontato in questo contributo. Per ora, abbiamo voluto far constatare che, dietro ogni singolo numero o informazione dato dalle testate giornalistiche o da qualsiasi altro mezzo di comunicazione, c’è un lavoro notevole.

Lavoro frutto di secoli di studi ed esperimenti, svolto da eminenti scienziati e scienziate a cui si deve sempre profondissimo rispetto e considerazione. Non solo formule dunque, o sterili numeri ed elenchi. Ma filosofie di fondo ed approcci intellettuali a volte molto differenti fra di loro.

Leggi anche: COVID-19 e statistica: seconda parte

Exit mobile version