“In medio stat virtus”

deep-thought

«La risposta alla domanda fondamentale sulla vita, l’universo e tutto quanto è… 42. Sì, ci ho pensato attentamente è questa, 42. Certo sarebbe stato più semplice se avessi conosciuto la domanda.»

Quelle sopra riportate sono le parole di Pensiero Profondo (nell’originale Deep Thought), un immaginario computer che compare nella Guida galattica per gli autostoppisti di Douglas Adams.
Pensiero Profondo è un calcolatore gigantesco programmato da una “razza di esseri superintelligenti e pandimensionali” per trovare “la risposta alla domanda fondamentale sulla vita, l’universo e tutto quanto”. Nell’immagine a destra ne vediamo la rappresentazione che ne è stata data nella versione cinematografica del libro.
Nel romanzo, Pensiero Profondo impiega sette milioni e mezzo di anni di elaborazioni per trovare la risposta e, come si può leggere sopra, tale risposta era 42!

Tralasciamo l’ironia dell’autore sul fatto che anche una risposta molto precisa non ha significato se non si abbia piena comprensione della domanda di partenza e utilizziamo il numero 42 come punto di partenza per illustrare il significato di media aritmetica.

Immaginiamo che il risultato trovato dalla straordinaria capacità di calcolo di Pensiero Profondo non sia altro che il Valore Vero di una grandezza che vogliamo misurare. In qualche modo, che noi umani limitati non siamo in grado di comprendere, il super computer è riuscito a determinare che le misure che noi andiamo ad eseguire sul nostro oggetto di prova “dovrebbero” risultare tutte in un valore di “42”.
Purtroppo però questo non accade. Facciamo 10 misurazioni e ci troviamo con 10 valori che, pur essendo vicini a 42, non lo centrano mai!
Evidentemente, visto che in questo caso particolare noi il Valore Vero lo conosciamo, le nostre misure sono affette da errore. Gli statistici chiamano questo particolare tipo di errore scarto e così lo chiameremo per il resto del paragrafo.
Lo scarto non è altro che la differenza fra il valore misurato e il Valore Vero. Quanto manca alla nostra misura per raggiungere il Valore Vero o di quanto lo eccede.
Possiamo anche interpretarlo come la distanza fra misura e Valore Vero.
Nella tabellina che segue vediamo qualche esempio numerico. Supponiamo di fare qualche misura, diciamo dieci valori, e calcoliamo gli scarti rispetto al Valore Vero 42.

Valore misurato Valore Vero Scarto
44 42 2
43 42 1
47 42 5
39 42 -3
38 42 -4
34 42 -8
49 42 7
49 42 7
47 42 5
41 42 -1

Dalla tabella vediamo che le misure “girano intorno” al valore vero, ma non lo centrano mai. Questo non è un grosso problema in questo caso perchè Pensiero Profondo ci ha fornito il risultato in anticipo, ma cosa si può fare nel caso in cui il Valore Vero sia sconosciuto?

Si può fare un ragionamento sugli scarti. Sappiamo che ogni singolo valore di scarto è funzione del valore vero rispetto al quale è calcolato. Indicheremo questo Valore Vero, che adesso supporremo ignoto, col simbolo \bar{x} e andremo a sommare tutti gli scarti per avere un valore S che rappresenti lo Scarto Totale.
Quindi, utilizzando il pedice i per indicare l’i-esimo scarto, in formule abbiamo:

\displaystyle s_{i}=x_{i}-\bar{x}

E lo scarto totale sarà:
\displaystyle S=\sum_{i=1}^{n}s_{i}=\sum_{i=1}^{n}\left (x_{i}-\bar{x}\right)

Se supponiamo di non conoscere il Valore Vero, nella formula di cui sopra il valore \bar{x} sarà incognito, ma possiamo ricavarlo se supponiamo di imporre uguale a zero lo scarto totale.
In pratica stiamo cercando un Valore Vero che abbia la caratterstica di essere equidistante da tutte le nostre misure. Scegliendo un Valore Vero con questo criterio sbagliamo il meno possibile perchè per ogni misura che si allontana in un senso da questo valore ce ne sarà una o più che la bilanciano nella direzione opposta.

Ne risulta:

\displaystyle \sum_{i=1}^{n}s_{i}=0\Rightarrow \sum_{i=1}^{n}\left (x_{i}-\bar{x}\right)=0 \Rightarrow \sum_{i=1}^{n}x_{i}-\sum_{i=1}^{n}\bar{x}=0\Rightarrow \sum_{i=1}^{n}x_{i}-n\bar{x}=0

Che infine porta alla formula che tutti conosciamo per il calcolo della media aritmetica:

\displaystyle \bar{x}= \frac{1}{n}\sum_{i=1}^{n}x_{i}

Visto che l’argomento di questo articolo è l’errore, calcoliamo veramente la media dei valori per il nostro piccolo esperimento e cerchiamo di capire di quanto sbagliamo se utilizziamo la media aritmetica al posto del Valore Vero, approfittando della fortuna di aver avuto Pensiero Profondo che ce ne ha fornito il valore.

In questo caso la media vale 43.1 a fronte di un Valore Vero di 42.
Si sbaglia di un 1.1 (che, guardacaso è anche la media degli scarti).
Ciò significa che le nostre misure, per qualche motivo, non erano distribuite in modo perfettamente uniforme attorno al Valore Vero, ma leggermete spostate in eccesso.
Cionondimeno, non conoscendo a priori il valore di 42, assumere il 43.1 come rappresentativo del Valore Vero è tutto ciò che possiamo fare.

Come si diceva, bisogna venire a patti con l’errore e tenere presente che la media aritmetica è solo un estimatore del Valore Vero.
Per il resto la statistica ci fornisce altri strumenti per capire quanto la nostra stima sia accurata, ma questo eccede i limiti di questo articolo.