Varijansa i standardna devijacija su najčešće korišćene mere varijabiliteta.

Varijansa uzorka se označava sa s2, a varijansa populacije sa σ2.

Standardna devijacija uzorka se označava sa s, a parametar sa σ.

Varijansa i standardna devijacija su u direktnom odnosu, jer je varijansa kvadratni stepen standardne devijacije, a standardna devijacija je kvadratni koren varijanse.

Kao i aritmetička sredina koriste se na podacima koji su na intervalnom ili racio nivou merenja.

Varijansa i standardna devijacija se koriste u statistici zaključivanja.

Formalna definicija varijanse je da je ona prosek kvadrata razlike skorova i aritmetičke sredine. Iz definicije sledi da se prilikom izračunavanja varijanse prvo računa razlika svakog rezultata od aritmetičke sredine, zatim se razlika kvadrira i kvadrirana razlika podeli sa brojem rezultata u distribuciji. Formula za izračunavanje varijanse populacije je

Formula za izračunavanje varijanse populacije

Formula za izračunavanje varijanse uzorka, ukoliko se koristi u svrhu deskripcije podataka glasi

Formula za izračunavanje varijanse uzorka kada se koristi u svrhu statističkog zaključivanja

a ako se koristi za statističko zaključivanje, tada formula glasi

Formula za izračunavanje varijanse kada se koristi u statističkom zaključivanju

Za izračunavanje varijanse uzorka postoje dve formule, u zavisnosti od svrhe u koju se koriste. Razlika između te dve formule je u imeniocu: formula za izračunavanje varijanse uzorka koja se koristi u svrhu deskripcije podataka u imeniocu ima n, a formula koja se koristi za izračunavanje varijanse uzorka za statističko zaključivanje u imeniocu ima n-1. To znači da će se sa povećanjem n, odnosno povećanjem uzroka, povećavati i razlika između vrednosti varijanse izračunatih po dvema formulama.

Pošto je vrednost varijanse izračunata po formuli za deskripciju podataka uvek manja od vrednosti varijanse izračunate po formuli za statističko zaključivanje, vrednost varijanse izračunata po prvoj formuli će biti potcenjena u odnosu na varijansu populacije. Što je uzorak manji, izračunata vrednost varijanse uzorka će biti više potcenjena u odnosu na stvarnu vrednost varijanse populacije. Iz tog razloga se za izračunavanje varijanse uzorka najčešće koristi formula koja u imeniocu ima n-1

Formula za izračunavanje standardne devijacije populacije je

Formula za izračunavanje standardne devijacije populacije

a za uzorak, bez obzira na svrhu upotrebe

Formula za izračunavanje standardne devijacije uzorka

Varijansa nije pogodna za opis varijabiliteta jer sadrži kvadrat odstupanja pojedinačnih rezultata od aritmetičke sredine. Zato se za opis varijabiliteta koristi standardna devijacija.

Primer: Izračunavanje varijanse i standardne devijacije

Na primeru visine devojčica u 52 odeljenju osnovne škole "X" (u cm) koji smo koristili za primer izračunavanja aritmetičke sredine, medijane, moda i ranga, dobili smo sledeće podatke: 140, 141, 138, 140, 122, 160, 154, 132, 148, 135, 140. Izračunali smo da je vrednost aritmetičke sredine 140.91cm.

Ukoliko bi nas u istraživanju interesovala samo visina devojčica u 52, onda bi se radilo o populaciji. U ovom primeru navedene podatke smatraćemo uzorkom.

Postupak izračunavanja varijanse i standardne devijacije ćemo pokazati kroz tabelu koja je formirana imajući u vidu sledeću formulu za varijansu uzorka:

Formula za izračunavanje varijanse uzorka u svrhu statističkog zaključivanja

X Xi-X (Xi-X)2 X2
140 -0.91 0.8281 19600
141 0.09 0.0081 19881
138 -2.91 8,4681 19044
140 -0.91 0.8281 19600
122 -18.91 357.5881 14884
160 19.09 364.4281 25600
154 13.09 171.3481 23716
132 -8.91 79.3881 17424
148 7.09 50.2681 21904
135 -5.91 34.9281 18225
140 -0.91 0.8281 19600
Σ=1550 Σ=1068,909 Σ=219478

Suma kvadrata odstupanja rezultata od aritmetičke sredine je 1068.909, s2=1068.909/(11-1)=106.89, a s=√106.89=10.34

Odgovor: Varijansa visine devojčica u 52 odeljenju škole „X“ je s2=106.891, a standardna devijacija s=10.34.

Vrednost standardne devijacije ili varijanse nikada ne može biti negativan broj. Negativna vrednost standardne devijacije ili varijanse ukazuje na grešku u izračunavanju.

Najmanja moguća vrednost varijanse i standardne devijacije je 0 i to se dešava kada su svi rezultati u distribuciji jednaki.

Varijansa i standardna devijacija su osetljive na ekstremne vrednosti, jer se baziraju na distanci pojedinačnih rezultata od aritmetičke sredine.