Calcolatore della Deviazione Standard
Incolla un elenco di numeri e il calcolatore restituisce la media, la varianza, la deviazione standard (sia campione s con denominatore n−1 che popolazione σ con denominatore n), il coefficiente di variazione e i punteggi z per ciascun valore. Utile quando vuoi sapere quanto i tuoi dati sono dispersi attorno alla loro media — un diagnostico chiave prima di eseguire qualsiasi test parametrico.
Come viene calcolata la deviazione standard
-
1
Incolla i tuoi numeri
Separati da virgole, spazi o nuove righe. Le voci non numeriche vengono ignorate.
-
2
La media x-bar viene calcolata
Somma divisa per il conteggio.
-
3
Le deviazioni quadrate vengono sommate
somma((x − x-bar)²).
-
4
Dividi e prendi la radice
Campione: dividi per (n−1), prendi √. Popolazione: dividi per n, prendi √.
Campione vs popolazione — quando usare quale
| Usa popolazione (n divisore) | Usa campione (n−1 divisore) |
|---|---|
| Hai l’intera popolazione | Hai un campione estratto da una popolazione più grande |
| Censimento completo dei dipendenti | 20 clienti campionati da migliaia |
| Tutti i 10 lanci di un dado in una sessione specifica | Misurazioni da una linea di produzione |
Il divisore n−1 (correzione di Bessel) produce un estimatore imparziale della varianza della popolazione dai dati del campione. Con n come divisore si sottovaluta sistematicamente la vera varianza della popolazione. Per grandi n la differenza si riduce, ma è importante per piccoli campioni.
Intuizione sulla deviazione standard
Se un insieme ha media 100 e SD 15, allora (assumendo una distribuzione approssimativamente normale):
- 68% dei valori rientrano tra 85-115 (1 SD)
- 95% tra 70-130 (2 SD)
- 99.7% tra 55-145 (3 SD)
Questa è la regola 68-95-99.7, nota anche come regola empirica. I punteggi IQ, le altezze umane e molte misurazioni naturali la seguono da vicino.
Coefficiente di variazione
CV = SD / media. Una misura senza unità di dispersione — utile quando si confronta la variabilità tra dataset con medie diverse. Un CV di 0.1 (10%) significa che la SD è circa il 10% della media. Non significativo per dati che possono attraversare zero.
Punteggi z
Per ciascun valore x: z = (x − media) / SD. Ti dice quanti SD sopra o sotto la media si trova quel valore. |z| > 2 è spesso segnalato come anomalo; |z| > 3 è piuttosto raro nei dati normali.
Errori comuni
- Usare la popolazione quando dovresti usare il campione. Sottovaluta la variabilità in un dataset campione.
- Mescolare media e SD di diverse unità. Controlla sempre la scala.
- Applicare regole di distribuzione normale a dati non normali. Dati distorti o multimodali rompono l’euristica 68-95-99.7. Traccia prima un istogramma.
- Ignorare gli outlier. Un valore estremo può triplicare la tua SD. Esistono alternative robuste (deviazione assoluta mediana, intervallo interquartile) per dati con code pesanti.
Domande frequenti
Excel ha due funzioni: STDEV (campione, denominatore n−1) e STDEVP (popolazione, denominatore n). Assicurati di utilizzare quella che corrisponde all’assunzione di campione o popolazione che desideri.
Sì — la SD ha le stesse unità delle tue misurazioni (cm, dollari, secondi). La varianza è in unità quadrate, motivo per cui la SD è più leggibile.
La SD del campione è definita per n >= 2. Sotto circa n=30, considera di riportare intervalli di confidenza attorno alla SD o di utilizzare un’alternativa robusta.
La SD è ancora definita. Per una proporzione p, SD = sqrt(p × (1−p)). Un campione con il 60% di uno ha SD = sqrt(0.6 × 0.4) ~= 0.49 indipendentemente da quanti osservazioni.