Avvertenze: la prima puntata della serie è qui, se non l'avete letta fatelo prima di attaccare questa, altrimenti potreste perdervi in fretta. Nel testo che state per leggere ci sono dei numerelli, ma le sole operazioni che dovete sapere fare per seguire il ragionamento sono la moltiplicazione e la radice quadrata. E potete usare la calcolatrice, non controllo!
Riprendiamo dal nostro segnale, il puzzone di Piggs, e il suo fastidioso rumore di fondo, il bruglione di Yan, che lo imita in tutto e per tutto, e per di più avviene più spesso. In entrambi i casi, come dicevamo, si tratta di fenomeni relativamente rari: il bruglione di Yan si manifesta in media 10 volte ogni 10000 collisioni, il puzzone di Piggs, se esiste, in media soltanto 1 volta.
I fenomeni che avvengono raramente, e su questo dovrete credermi sulla parola, seguono nel loro apparire una distribuzione di probabilità detta di Poisson. Questa distribuzione ha diverse proprietà matematiche interessanti, che vi lascio andare a scoprire da soli se volete approfondire. Per quello che vogliamo fare qui, ci interessa conoscere soltanto un paio di caratteristiche di base. La prima proprietà, come potete immagine se avete letto la puntata precedente, è il suo valore medio. Se studiate un fenomeno poissoniano, che ha la proprietà di manifestarsi 1 volta ogni N misure (per esempio, ogni N collisioni), nel caso voi facciate M misure potete aspettarvi di osservare in media M/N volte il fenomeno. Se il bruglione di Yan si manifesta in media 1 volta ogni 1000 collisioni, se ne misurate 10000 vi aspettate di osservarlo in media 10 volte. Semplice, vero?
La seconda proprietà è la deviazione standard, la "sigma", della distribuzione, anch'essa incontrata nella puntata precedente. La distribuzione di Poisson è particolarmente comoda per i calcoli, perché se il suo valore medio è K, la sua sigma è la radice quadrata di K. Se in 10000 interazioni vi aspettate di osservare in media 10 volte il bruglione di Yan, la sigma della corrispondete distribuzione di probabilità è la radice quadrata di 10, ovvero un po' più di 3. Come ricorderete, la "sigma" di una distribuzione misura quanto è probabile che osserviate un valore diverso da quello medio della distribuzione. Nel caso della distribuzione di Poisson (che in certi regimi non si comporta in modo troppo diverso dalla distribuzione normale), l'intervallo compreso tra il valor medio atteso più o meno una sigma contiene approssimativamente il 68% delle osservazioni possibili. Se osservate l'apparire del brugliore di Yan in 10000 collisioni, in circa 68% dei casi potete aspettarvi che apparirà un numero di volte compreso tra poco meno di 7 e poco più di 13. L'intervallo compreso tra il valor medio e 3 sigma comprende circa il 99.7% di valori possibile, quello tra il valor medio più o meno 5 sigma il 99.9999%.
Veniamo dunque alle nostre prime 10000 interazioni. Ci aspettiamo (ce l'ha detto il nostro amico teorico) in media 10 accensioni di lampadina causate dal bruglione di Yan, con una sigma di più o meno 3 accensioni, e 1 accensione potenzialmente dovuta al puzzone di Piggs, la particella ignota di cui siamo alla ricerca, con una sigma di... 1 accensione! Immaginate dunque di osservare 13 accensioni: state forse vedendo l'apparire di puzzone di Piggs, o state semplicemente visionando il bruglione di Yan, che conoscete bene e che vi interessa poco? Purtroppo per voi, non potete dire (ancora) molto. 13 accensioni sono in effetti più delle 10 che vi aspettereste in media per il solo bruglione, ma l'eccesso che osservate non è (ancora) significativo. Siccome la statistica di Poisson governa la frequenza delle apparizioni di bruglione e puzzone, sapete bene che 13 accensioni dovute al solo bruglione, invece che le 10 medie, sono un'eventualità piuttosto probabile. In effetti, un'eventualità possibile circa un terzo delle volte: se doveste rifare l'acquisizione dei vostri 10000 eventi altre 2 volte, potete stare quasi sicuri che l'eccesso sparirà. Mentre il numero eventuale di puzzoni di Piggs (1 in media, ma troppo facilmente anche 2 o nessuno) è ancora troppo piccolo per poterlo distinguere.
Che fate allora? Aspettate, e continuate a misurare, a raccogliere dati, a collezionare collisioni. Vediamo come la situazione evolve se invece di 10000 collisioni ne abbiamo raccolte 1000000. In un milione di collisioni ci aspettiamo di osservare in media 1000 accensioni di lampadina dovute al brugliore di Yan, con una sigma di circa 31 (la radice quadrata di 1000), mentre le accensioni potenzialmente dovute al puzzone di Piggs sarebbero 100, con una sigma di 10. Se in un milione di collisioni osservate 1103 accensioni, questa volta l'eccesso diventa intrigante. Potrebbe trattarsi ancora di una fluttuazione del rumore di fondo? Certamente, ma questa volta si tratterebbe di un eccesso che supera il valor medio atteso (1000) di più di 3 volte la sigma della distribuzione (3 per 31 fa 93, e voi avete un eccesso di 103 accensioni). Una simile fluttuazione del bruglione di Yan ha una probabilità di avvenire solo 1 volta ogni 370 esperimenti che raccolgano un milioni di eventi, cosa non impossibile ma molto più rara. In questo caso, normalmente vi permettereste di parlare di "evidenza" di un fenomeno, e di "osservazione di un eccesso". Molto probabilmente pubblichereste qualcosa, ma ovviamente con molta cautela.
Per essere sicuri che il vostro eccesso sia genuino volete che le probabilità di una fluttuazione del rumore di fondo siano veramente minuscole, praticamente trascurabili. Se raccogliete un altro milione di interazioni fino ad averne 2 milioni, vi attendete 2000 accensioni dovute al bruglione, con una sigma di circa 41. Se osservate 2215 accensioni, il vostro eccesso (215 accensioni in più delle 2000 attese in media) rappresenta più di 5 volte la sigma del rumore di fondo: in questo caso, si tratterebbe di una fluttuazione del rumore di fondo che ha una probabilità di accadere ogni 1700000! D'altra parte, vi attendereste in media 200 accensioni potenzialmente dovute al puzzone, con una sigma di 14 accensioni: l'eccesso è infinitamente più probabilmente dovuto alla presenza di un secondo fenomeno oltre al bruglione, e certamente compatibile con l'esistenza del puzzone ("infinitamente" è un eufemismo: quanto questo secondo scenario sia più probabile è qualcosa che si può calcolare con precisione, ma in questa sede non ci proveremo nemmeno!). Se ve la sentite, in questo caso potete finalmente parlare di "scoperta", perché l'eccesso che osservate è statisticamente significativo.
Tutto a posto? Nella maggio parte dei casi, si. Champagne, applausi, seminario pubblico, magari premio Nobel. A meno che (perché c'è sempre un "a meno che")... Tutto il ragionamento fatto sino ad adesso si basa sull'ipotesi che le proprietà del rumore di fondo, quello che abbiamo chiamato il bruglione di Yan, siano ben note. Questo è spesso vero, ma quando si sperimenta in regimi energetici nuovi (per esempio a LHC!), potrebbe non essere così certo. Il bruglione di Yan potrebbe essere stato studiato con cura con un acceleratore che ha lavorato a 2 TeV, e le previsioni di come dovrebbe manifestarsi a 7 TeV potrebbero essere state estrapolate sulla base di calcoli teorici. Come fare a fidarsi? Che succederebbe se il bruglione di Yan si presentasse in realtà in media 11 volte in 10000 eventi, invece delle 10 inizialmente previste? Il ragionamento fatto prima sarebbe ancora valido? Vediamo un po'. In 2 milioni di eventi mi dovrei aspettare 2200 eventi (e non i 2000 che erroneamente credevo) con una sigma di circa 46. La mia osservazione di 2215 accensioni di lampadina assume immediatamente un significato diverso, non trovate?
Sbagliare a stimare il "rumore di fondo" è uno degli errori sistematici più comuni nella fisica delle alte energie. Per evitarlo, esiste una sola strategia: invece di affidarsi a predizioni teoriche, mettersi in condizione di misurare il ritmo di produzione del rumore di fondo direttamente dai dati. Per farlo, occorre trovare una zona di osservazione dove siate sicuri che si manifesti solo il bruglione di Yan, e misurarne le proprietà in questa regione. È quello di cui parleremo alla prossima puntata.
© Marco @ Borborigmi di un fisico renitente, 12/12/2011. (Some right reserved)|
Permalink |
31 commenti
Archiviato in Fisica| Tag: deviazione standard, errore s, evidenza, formulette, intervalli di confidenza, media, Poisson, scoperta, sigma, Statistica