Mere povezanosti između varijabli predstavljaju način sumiranja jačine veze između dve ili više varijabli. Za dve varijable se kaže da su povezane kada poznavanje informacija o jednoj varijabli može pomoći u predviđanju vrednosti druge. Osim jačine, neke mere povezanosti mogu otkriti i smer veze između varijabli.

Termini korelacija i povezanost se često koriste kao sinonimi, ali neki autori između njih prave razliku. Prema njima, povezanost je širi pojam i obuhvata bilo kakvu vrstu veze između varijabli, dok se pod korelacijom obično podrazumeva samo linearna veza između varijabli. Mnogi autori svrstavaju analizu povezanosti varijabli pod deskriptivnu statistiku, a ne statistiku zaključivanja.

Vrste povezanosti između varijabli

Mere povezanosti mogu biti linearne i nelinearne. Linearna povezanost označava takvu vrstu povezanosti između varijabli kod koje se vrednost jedne varijable iskazuje putem druge varijable, koeficijenta koji stoji uz nju u odnosu multiplikacije i konstante koja se dodaje na ovaj proizvod. Matematički se linearna povezanost prikazuje na sledeći način:

Y = a + b*X

gde su X i Y varijable čija se povezanost posmatra, a je konstanta, a b je koeficijent uz X.

Linearna veza se grafički predstavlja pravom linijom. Nelinearna asocijacija označava takvu povezanost varijabli kod koje se veza između varijabli ne može redukovati na linearnu vezu, a grafički predstavljena može poprimiti oblik krive različitih oblika.

Intenzitet povezanosti govori o proporciji u kojoj promena jedne varijable izaziva promenu druge varijable. Generalno pravilo je da potpuna povezanost postoji kada promena jedne varijable izaziva promenu druge varijable u istoj meri, dok potpuna nepovezanost postoji kada promena vrednosti jedne varijable uopšte ne utiče na vrednost druge varijable. Ovakvi ekstremi su u praksi veoma retki. Potpuna povezanost je moguća jedino ako dve varijable potiču iz iste marginalne distribucije. Uobičajeno je da povezanost bude između ova dva ekstrema, pa govorimo o slaboj, osrednjoj, jakoj i veoma jakoj povezanosti između varijabli. Ovakve kategorizacije su u velikoj meri proizvoljne i služe za lakše tumačenje odnosa koji postoje između varijabli.

Odnos između dve varijable može biti upravo proporcionalan ili obrnuto proporcionalan. To se još naziva pozitivnom ili negativnom korelacijom, respektivno. Pozitivna povezanost između dve varijable postoji kada porast vrednosti jedne varijable u proseku dovodi do veće vrednosti druge varijable. Obrnuto je kod negativne povezanosti - porast vrednosti jedne varijable u proseku prouzrokuje manje vrednosti druge varijable. Ova karakteristika povezanosti se naziva smer povezanosti.

Treba praviti razliku između simetričnog i asimetričnog tipa povezanosti. Kod simetričnog tipa povezanosti, promena vrednosti varijable X utiče na promenu vrednosti varijable Y i obrnuto, promena vrednosti varijable Y vodi ka promeni vrednosti varijable X. Asimetrični tip povezanosti označava takvu vezu kod koje promena vrednosti jedne varijable utiče na promenu vrednosti druge varijable, ali obrnuto ne važi. Asimetrična povezanost postoji kod kauzalnih veza, tj. kada su pojave koje merimo u uzročno-posledičnoj vezi.

Moguće je da povezanost između dve varijable postoji u čitavom domenu u kojem su varijable definisane. Tada govorimo o neprekidnoj asocijaciji. U suprotnom, ako povezanost postoji samo u delu domena u kojem su varijable definisane, radi se o isprekidanoj asocijaciji.

Metode utvrđivanja povezanosti varijabli

Mere povezanosti se mogu odrediti različitim vrstama analize, a sve su izgrađene na konceptu proporcionalne redukcije greške. Metode za otkrivanje povezanosti se mogu bazirati na grafičkom prikazu odnosa ili nekom vrstom koeficijenta. Najčešće se u praksi koriste dijagram rasturanja i koeficijent korelacije.

Dijagram rasturanja omogućava brzo uočavanje povezanosti između varijabli, jer vizuelno prikazuje jačinu i smer veze, ali ne daje precizne numeričke pokazatelje te povezanosti. S druge strane, koeficijenti su precizniji u kvantifikaciji veze, ali oni iskazuju prosek, a njihovo tumačenje je složenije. Zato se ove dve metode često kombinuju, tako što se prvo nacrta dijagram rasturanja, a zatim se ide u precizniju analizu putem nekog od koeficijenata. Izbor metoda identifikacije povezanosti zavisi i od vrste varijabli čija se povezanost ispituje.

Moguće je za utvrđivanje relacije između varijabli koristiti i druge metode. Kada istraživanje uključuje više varijabli, u cilju analize njihove povezanosti, kao jedan od prvih koraka u istraživanju konstruiše se matrica koeficijenata korelacije koja sadrži koherentan prikaz svih parova veza između varijabli u istraživanju, a uključuje informacije o koeficijentu korelacije i njegovoj statističkoj značajnosti. Regresiona analiza omogućava izračunavanje koeficijenta višestruke korelacije i parcijalnih koeficijenata korelacije koji omogućavaju identifikaciju povezanosti više od dve varijable. Za utvrđivanje povezanosti se mogu koristiti i Χ2 test povezanosti, relativni odnos rizika i šansi i dr.