VARIANZA - Excel e Fogli Google

Questo tutorial mostra come usare il Funzione VARIANZA di Excel in Excel per stimare la varianza in base a un dato campione.

VARIANZA Panoramica della funzione

La funzione VARIANCE Calcola la varianza stimata in base a un dato campione.

Per utilizzare la funzione del foglio di lavoro Excel VARIANCE, selezionare una cella e digitare:

(Notare come appaiono gli input della formula)

Funzione VARIANZA Sintassi e ingressi:

1 =VAR(numero1,[numero2],… )

numeri- Valori per ottenere la varianza

Come calcolare la varianza in Excel

La varianza ti dice come sono distribuiti i valori in un set di dati dalla media. Matematicamente parlando, la varianza è la media della differenza al quadrato di ciascun punteggio dalla media (ma ci arriveremo tra poco).

Excel offre una serie di funzioni per calcolare la varianza: VAR.S, VAR.P, VARA, VARPA e due funzioni precedenti, VAR e VAR.POP.

Prima di approfondire queste funzioni e imparare a usarle, parliamo della varianza e di come viene calcolata.

Cos'è la varianza?

Quando si analizzano i dati, un primo passo comune è calcolare la media. Questa è ovviamente una statistica utile da calcolare, ma non ti dà il quadro completo di cosa sta succedendo ai tuoi dati.

Prendi il seguente set di dati, che potrebbe essere un gruppo di risultati del test con punteggio su 100:

1 48,49,50,51,52

La media di questo intervallo è 50 (somma i numeri e dividi per n, dove n è il numero di valori).

Quindi, prendi il seguente set di risultati del test:

1 10,25,50,75,90

La media di questo intervallo è anche 50 - ma ovviamente abbiamo due intervalli di dati molto diversi qui.

Di per sé, la media non può dirti nulla su quanto siano sparsi i punteggi. Non ti dice se i valori sono tutti raggruppati come nei primi esempi o distanziati come il secondo. La varianza può aiutarti a impararlo.

La varianza viene utilizzata anche come punto base per una serie di procedure statistiche più complesse.

Come viene calcolata la varianza

Analizziamo un esempio di base e calcoliamo la varianza a mano. In questo modo, saprai cosa sta succedendo dietro le quinte quando inizierai effettivamente a mettere in atto le funzioni di varianza di Excel.

Supponiamo di avere un set di dati che rappresenta tre carte da gioco, un 4, un 6 e un 8.

Per calcolare la varianza, segui questo processo:

1) Calcola la media

Per prima cosa calcoliamo la media. Sappiamo che il nostro intervallo di dati è 4, 6, 8, quindi la media sarà:

1 (6 + 4 + 8) / 3 = 6

L'ho confermato di seguito con la funzione MEDIA di Excel<>:

1 =MEDIA(C4:C6)

2) Sottrarre la media da ciascun valore nel set di dati

Quindi, sottraiamo la media da ciascuno dei nostri valori.

L'ho fatto con la seguente formula:

1 =C4-$H$4

La media è memorizzata in H4, quindi la sottraggo da ogni valore nella tabella. I simboli del dollaro qui semplicemente "bloccano" quel riferimento di cella a H4, in modo che quando lo copio nella colonna, rimane lo stesso.

I risultati:

Abbiamo:

123 4 - 6 = -26 - 6 = 08 - 6 = 2

Dobbiamo ottenere la media di queste differenze dalla media, ma la media di questi tre valori è zero! Quindi dobbiamo enfatizzare le differenze, cosa che facciamo squadrandole.

3) Piazza le differenze

Aggiungiamo una nuova colonna e quadrate i numeri nella colonna D:

1 =D4*D4

Ok, è meglio. Ora che le differenze non raggiungono la media a zero, possiamo calcolare la varianza.

4) Calcola la media delle differenze al quadrato

Qui incontriamo un bivio. Ci sono due modi per calcolare la varianza e quello che usi dipende dal tipo di dati che hai.

  • Se stai usando dati sulla popolazione, prendi semplicemente la media come normale (somma i valori e dividi per n)
  • Se stai usando dati di esempio, sommi i valori e dividi per n-1

I dati sulla popolazione significano che hai la totalità dei dati di cui hai bisogno, ad esempio, se vuoi l'età media degli insegnanti in una particolare scuola e hai i dati sull'età per ogni singolo insegnante in quella scuola, hai i dati sulla popolazione.

Dati di esempio significa che non hai tutti i tuoi dati, solo un campione prelevato da una popolazione più ampia. Quindi, se vuoi l'età media degli insegnanti in tutto il paese e hai solo dati sugli insegnanti di una scuola, hai dati di esempio.

Nel nostro esempio, abbiamo i dati sulla popolazione. Ci interessano solo le nostre tre carte: questa è la popolazione e non ne abbiamo preso un campione. Quindi possiamo semplicemente prendere la media delle differenze al quadrato nel modo normale:

1 =MEDIA(E4:E8)

Quindi la varianza della nostra popolazione è 2,666.

Se questo era dati di esempio (forse abbiamo estratto queste tre carte da un set più grande), calcoliamo la media come segue:

1 Varianza del campione = (4 + 0 + 4) / (3 - 1)

O:

1 Varianza del campione = 8 / 2 = 4

Perché dividere per n-1 con dati di esempio, invece di solo n?

La risposta breve a questa domanda è "Perché dà la risposta giusta". Ma immagino che vorrai un po' di più! Questo è un argomento complesso, quindi darò solo una breve panoramica qui.

Pensala in questo modo: se prendi un campione di dati da una popolazione, quei valori tenderanno ad essere più vicini alla media del campione di quanto non siano alla media del popolazione.

Ciò significa che se dividi semplicemente per n, sottovaluterai un po' la varianza della popolazione. Dividere per n-1 lo corregge un po'.

Con il nostro set di tre carte, siamo in un buon posto per testare questa teoria. Poiché ci sono solo tre carte, c'è un piccolo numero di campioni che possiamo eventualmente prelevare.

Prendiamo campioni di due carte. Sceglieremo una carta, la rimetteremo a posto, mescoleremo e poi ne sceglieremo un'altra. Ciò significa che ci sono nove combinazioni di due carte che possiamo scegliere.

Con solo nove possibili campioni, possiamo calcolare ogni possibile varianza campionaria usando entrambi i metodi (dividere per n e dividere per n-1), prenderne la media e vedere quale ci dà la risposta giusta.

Nella tabella qui sotto, ho disposto tutto. Ogni riga della tabella è un campione diverso e le colonne B e C mostrano le due carte che sono state scelte in ogni campione. Poi ho aggiunto altre due colonne: una dove ho calcolato la varianza di quel campione di due carte dividendo per n, e un'altra dove ho diviso per n - 1.

Guarda:

A destra della tabella, ho mostrato le medie delle colonne D ed E.

La media della colonna D, dividendo per n, ci dà una varianza di 1,333.

La media della colonna E, dividendo per n-1, ci dà una varianza di 2,666.

Sappiamo già dal nostro esempio precedente che la varianza della popolazione è 2,666. Quindi, dividendo per n-1 quando si utilizzano dati di esempio, si ottengono stime più accurate.

Le funzioni di Excel per calcolare la varianza

Ora che hai visto un esempio di come viene calcolata la varianza, passiamo alle funzioni di Excel.

Hai diverse opzioni qui:

  • P restituisce la varianza per i dati della popolazione (usando il metodo della divisione per n)
  • S restituisce la varianza per i dati del campione (divide per n-1)
  • VAR è una funzione precedente che funziona esattamente allo stesso modo di VAR.S
  • VARA è lo stesso di VAR.S, tranne per il fatto che include celle di testo e valori booleani
  • VARPA è uguale a VAR.P, tranne per il fatto che include celle di testo e valori booleani

Esaminiamo questi uno per uno.

La funzione VAR.P di Excel

VAR.P calcola la varianza per i dati della popolazione (usando il metodo della divisione per n). Usalo in questo modo:

1 =VAR.P(C4:C6)

Definisci un solo argomento in VAR.P: l'intervallo di dati per il quale vuoi calcolare la varianza. Nel nostro caso qui, questi sono i valori delle carte in C4: C6.

Come vedi sopra, VAR.P restituisce 2.666 per il nostro set di tre carte. Questo è lo stesso valore che abbiamo calcolato a mano in precedenza.

Nota che VAR.P ignora completamente le celle contenenti testo o valori booleani (VERO/FALSO). Se è necessario includerli, utilizzare invece VARPA.

La funzione VAR.S di Excel

VAR.S calcola la varianza per i dati del campione (dividendo per n-1). Lo usi così:

1 =VAR.S(C4:C6)

Di nuovo, c'è solo un argomento: il tuo intervallo di dati.

In questo caso VAR.S restituisce 4. Abbiamo ottenuto la stessa cifra nel passaggio 4 quando abbiamo eseguito il calcolo manuale sopra.

VAR.S ignora completamente le celle contenenti testo o valori booleani (VERO/FALSO). Se è necessario includerli, utilizzare invece VARA.

La funzione VAR di Excel

VAR è completamente equivalente a VAR.S: calcola le varianze per i dati del campione (usando il metodo n-1). Ecco come usarlo:

1 =VAR(C4:C6)

VAR è una "funzione di compatibilità". Ciò significa che Microsoft sta rimuovendo questa funzione da Excel. Al momento è ancora disponibile per l'uso, ma dovresti invece utilizzare VAR.S, in modo che i tuoi fogli di calcolo rimangano compatibili con le versioni future di Excel.

La funzione VARA di Excel

VARA restituisce anche la varianza dei dati di esempio, ma presenta alcune differenze chiave rispetto a VAR e VAR.S. Vale a dire, include valori booleani e di testo nel suo calcolo:

  • I valori VERI vengono contati come 1
  • I valori FALSE vengono conteggiati come 0
  • Le stringhe di testo vengono conteggiate come 0

Ecco come lo usi:

1 =VARA(C4:C11)

Abbiamo aggiunto altre cinque righe alla tabella: J, Q, K, TRUE e FALSE. La colonna D mostra come VARA interpreta questi valori.

Poiché ora abbiamo un nuovo batch di valori bassi nella nostra tabella, la varianza è aumentata a 10,268.

La funzione VARPA di Excel

VARPA calcola la varianza per i dati sulla popolazione. È simile a VAR.P, tranne per il fatto che include anche valori booleani e stringhe di testo nel calcolo:

  • I valori VERI vengono contati come 1
  • I valori FALSE vengono conteggiati come 0
  • Le stringhe di testo vengono conteggiate come 0

Lo usi così:

1 =VARPA(C4:C12)

Abbiamo aggiunto altre cinque righe alla tabella: J, Q, K, TRUE e FALSE. La colonna D mostra come VARPA interpreta questi valori.

Come risultato dell'aggiunta di questo gruppo di valori inferiori ai dati, la varianza è aumentata a 8,984.

Funzione VARIANZA in Fogli Google

La funzione CORRELAZIONE funziona esattamente allo stesso modo in Fogli Google come in Excel:

Aiuterete lo sviluppo del sito, condividere la pagina con i tuoi amici

wave wave wave wave wave