SPSS

(Statistical package for Social Sciences)

Prva verzija programa je izašla 1967. godine. SPSS je veoma brzo postao jedan od najviše korišćenih statističkih programa za istraživanje tržišta, analizu anketa, u medicini i društvenim naukama. Od samog početka, autori su se fokusirali na akademske korisnike i trudili se da ostane jednostavan za upotrebu i prilagođen korisnicima koji nisu vešti sa računarom. IBM je kupio SPSS 2008. godine.

SPSS je kod nas verovatno najpopularniji statistički softverski paket. Namenjen je društvenim naukama. Mnoge funkcije su dostupne preko grafičkog korisničkog interfejsa i sistema menija, a napredne se moraju programirati u sintaksi i nisu dostupne putem menija. Iz menija se takođe generiše sintaksa koja se može prikazati u outputu. Programi se mogu pokretati interaktivno ili putem Production Job Facility. Makro jezik se može koristiti za pisanje jezičkih podrutina, a ima i Python ekstenziju putem koje je moguće pristupiti rečniku podataka i dinamički stvarati komande sintakse. Python ekstenzija omogućava i pokretanje bilo koje R funkcije.

U zavisnosti od vrste licence, košta između $1000 i $12000. Implementiran je bogat skup statističkih tehnika. Osnovna licenca obuhvata osnovne statističke tehnike i metode koje se koriste u društvenim naukama, kao što su ANOVA, analiza klastera, diskriminatorna analiza, faktorska analiza, regresija i korelacija, razne vrste testova, višedimenzionalno skaliranje i dr.

Kupovinom dodatnih licenci dobijaju se i dodatni moduli, kao što su:

  • analiza vremenskih serija.
  • obrada upitnika i dr.

SPSS se često koristi u biologiji i društvenim naukama jer omogućava da se na veoma lak način uradi standardni skup statističkih analiza koje se zahtevaju u mnogim akademskim disciplinama. S druge strane, fizičari, informatičari i statističari obično žele čudnije stvari koje se ne uklapaju lako u ove tradicionalne metode, pa se SPSS ređe koristi u ovim oblastima.

SPSS stavlja ograničenja na strukturu datoteke, tipove podataka, način obrade i odgovarajuće datoteke, što značajno pojednostavljuje programiranje. Podaci su uvek u formi dvodimenzionalne tabele u kojima redovi predstavljaju slučajeve (individue), a kolone merenja (varijable). Postoje samo dva tipa podataka: numerički i tekst.

Grafički korisnički interfejs ima dva taba. U jednom je prikazana matrica podataka, a u drugom metapodaci, tj. osobine varijabli (naziv, labela, tip varijable i dr.). Ima odlične mogućnosti za učitavanje i čuvanje podataka u različitim formatima, uključujući i pristup relacionim bazama podataka. Podatke je, osim u originalnom (proprietary) formatu, moguće sačuvati u Microsoft Word, PDF, Excel i drugim formatima a grafički output je moguće sačuvati u različitim standardnim grafičkim formatima.

U prilog upotrebi SPSS govore sledeće njegove karakteristike:

  • veoma se lako uči,
  • moćniji je od Minitab-a,
  • najčešće je korišćeni paket u akademskim krugovima i industriji,
  • ima meni i komandnu liniju,
  • jedan je od najmoćnijih paketa, a istovremeno je jednostavan za upotrebu.

S druge strane, veoma je skup i nije adekvatan za modelovanje i granične statističke analize.

SAS

(Statistical Analysis System)

Ima veoma komplikovan cenovni model. Licencira se godišnje, a prva godina upotrebe košta $8500.

SAS je nastao 1976. godine. Kompanija ima neprekinuti niz rastućih profita nezabeležen u softverskoj industriji. Veoma su česte nove verzije, pa se SAS smatra za najinovativniji statistički softver. SAS je poznat i kao jedna od najboljih kompanija za rad. Sofver radi na najrazličitijim platformama.

Komande se pokreću putem komandne linije, iako postoji i grafički korisnički interfejs i sistem menija koji obično samo automatizuje generisanje SAS programa. Funkcionalnostima se može pristpuiti kroz aplikativni interfejs u formi komandi i procedura. U odnosu na programske jezike opšte namene, ova struktura omogućava programeru da se manje koncentriše na tehničke podatke i način skladištenja podataka, a više na informacije sadržane u podacima. To zamagljuje granicu između programera i korisnika.

SAS ne forsira centralizovani pristup podacima. Najjači je u ANOVA, mešanim modelima i multivarijantnoj analizi, a najslabiji u ordinalnoj i multinomnoj logističkoj regresiji i robustnim metodama.

U prilog SAS-u ide njegova široka prihvaćenost kao lidera u statističkoj analizi i modelovanju, raspostranjena upotreba u industriji i akademskim krugovima, fleksibilnost i moć. S druge strane, SAS je veoma skup, nema prijatan korisnički interfejs, sporo se uči i ima relativno slabe grafičke sposobnosti.

EViews

Orijentisan je ka ekonometrijskim analizama. Može biti korišćen za opšte statističke analize, kao i za specifične ekonometrijske analize kao što su kros-sekcionalna analiza, analiza panel podataka i analiza vremenskih serija.

Minitab

Napravljen je 1980 godine na državnom univerzitetu Pensilvanije, a cena jedne licence je $1395. Često se koristi u osnovnim statističkim kursevima jer je lak za učenje. U Minitab-u se može raditi deskriptivna statistika, grafički prikaz, izračunavanje veličine uzorka, generisanje slučajnog broja, regresiona analiza i sl., ali je iznenađujuće ograničen u broju implementiranih funkcionalnosti u odnosu na SPSS ili SAS.

Pošto se lako uči, obično se koristi u školama u osnovnim kursevima statistike. Široko je u upotrebi i u inženjeringu za poboljšanje procesa. Međutim, relativno je skup u odnosu na druge licencne statističke pakete i nije pogodan za veoma komplikovana izračunavanja i analize, pa se obično ne koristi u akademskim istraživanjima.

Matlab

Ima elegantnu podršku za matricu i omogućava dobru vizualizaciju. S druge strane, skup je i ima ograničeni skup statističkih tehnika u odnosu na ostale pakete. Jezik mu je veoma slab i prilično liči na skript jezik kojim su učaurene funkcije za rad sa matricama. Veoma je dobar za razvijanje novih matematičkih algoritama i veoma je popularan u oblasti mašinskog učenja.

Tipično ga upotrebljavaju inženjeri jer je više orijentisan ka matematici nego ka statistici.