Razvoj statističkog softvera je uslovljen statističkom praksom, ali isto tako postoji i povratni uticaj razvoja informacione tehnologije na statistiku.
Prva generacija statističkih paketa javlja se 1960-tih godina. Ovi paketi su bili usmereni ka agregaciji, tj. redukciji podataka. Korisnik je imao malo izbora, a obrada je bila paketna. Naglasak je u tom periodu bio na numeričkoj preciznosti. Kasne šezdesete su počele da menjaju ove pretpostavke.
Do kraja 1970-tih se razvila dijagnostika podataka i generalizacija klasičnih modela, a počeli su da se razvijaju i grafički metodi. Interaktivni programi su u to vreme postojali, ali su ih statističari sporo prihvatali.
Veliki napredak se desio na metodima koji zahtevaju intenzivno računanje tokom 1980-tih godina. Tehnike re-uzorkovanja i polu-parametrijski modeli su uklonili okove linearnih modela i normalne teorije. Razvijene su dinamičke grafičke tehnike koje su rukovale sve složenijim podacima.
Mogućnosti statističkog softvera su polako napredovale od redukcije ka produkciji podataka. Širila se i oblast primene statističkog softvera. Statističari su se složili da su alternativna formulacija modela, dijagnostika, grafika i dr. neophodni za valjanu analizu podataka.
Neiskusni korisnici statističkog softvera su u tom periodu bili zanemareni. Inicijalni napori da se statističke ekspertize uključe u softver su imale za cilj da pomognu neiskusnim korisnicima da se snađu u džungli koja je nastala. Međutim, u to vreme još uvek nisu bili razvijeni metodi koji bi ove napore učinili praktičnim. Tipičan dizajn softvera je omogućavao pozadinsku dijagnostiku i izveštavanje samo o neuspešnim proverama, a samo ponekad i sa naznakom mera koje je potrebno preduzeti da bi se problem rešio.
U načelu, ideje usmerene ka uključivanju ekspertize u statističke programe nisu naišle na mnogo entuzijazma u statističkoj zajednici. Najveći kritičari uključivanju ekspertize su upozoravali na nemogućnost automatizacije “umetnosti” analize podatka. Jedan od problema izrade pametnog statističkog softvera je i odsustvo želje statističara da ga naprave, jer im je lakše da pišu knjige.
Kasniji napredak u razvoju statističkih paketa bi se mogao sažeti kao:
- integracija statističke ekspertize u statističke programe,
- upravljanje velikim skupovima podataka,
- implementacija novih algoritama koju je omogućila velika ekspanzija računarske snage.
Statistička ekspertiza treba da bude uključena u softver iz najmanje tri razloga:
- omogućavanje bolje analize ne-statističarima, kako bi im se pružila pomoć u korišćenju onih tehnika koje statističari smatraju korisnim,
- stimulacija razvoja boljeg softverskog okruženja za statističare,
- studiranje samog procesa analize podataka.
Softver sa statističkom ekspertizom je namenjen pre svega povremenim korisnicima koji žele aktivne sisteme, sisteme koji preuzimaju kontrolu. Oni žele black-box model. S druge strane, profesionalni statističari žele pasivne sisteme, sisteme koji rade po komandi.
Potreba za obradom velikog skupa podataka pojavila se pre svega kao posledica razvoja računarske snage i interneta. Postalo je moguće prikupljanje i skladištenje ogromne količine podataka, a tržišni trendovi su išli u pravcu personalizacije podataka o korisnicima usluga koja je zahtevala mnoštvo podataka o svakom pojedincu ili prikupljanje i obradu velikog broja relevantnih finansijskih i drugih informacija iz preduzeća i njegovog okruženja. Velika količina podataka postavlja izazove pred statističare, kako tehničke tako i metodološke prirode. Zato je bio potreban novi, multidisciplinarni pristup koji je povezao oblasti statistike sa oblastima baza podataka i raznih matematičkih teorija, a sve bazirano na inovativnim konceptima organizacije informaciono-komunikacione tehnike i jačanju snage hardvera.
Jedna od najpoznatijih tehnika koja je nastala kao posledica ovog trenda je rudarenje podataka (engl. data mining). To je proces u kojem se podaci analiziraju iz različitih perspektiva i agregiraju u korisne informacije. Softver za rudarenje podataka omogućava analizu više različitih dimenzija podataka, njihovu kategorizaciju i agregaciju identifikovanih relacija. Sa statističkog aspekta, radi se o pronalaženju korelacija ili obrazaca između velikog broja varijabli (kolona) u velikim relacionim bazama podataka.
Pojava i širenje statističkog softvera je nesumnjivo veoma mnogo doprinela razvoju istraživačkih studija u 21 veku. Statistički softver je glavni alat za istraživačku analizu, validaciju podataka i prezentaciju rezultata istraživanja.
Statistički softver omogućava istraživačima da se oslobode rutinskih matematičkih grešaka i da proizvedu tačne rezultate u svojim istraživanjima, pod uslovom da su uneli tačne podatke. Razvoj statističkog softvera omogućio je više kvantitativnih studija, a istraživači, profesionalci, naučnici i menadžeri mogu mnogo jasnije da predstave tačna predviđanja budućnosti koristeći mogućnosti savremenog statističkog softvera.
Napredak statističkog sotvera je omogućio i poboljšanje kvaliteta istraživačkih studija. Bilo koje kvantitativno istraživanje je nemoguće sprovesti bez statističkog softvera. Šta više, on omogućava profesionalcima interakciju sa podacima, štedeći vreme i oslobađajući prostor za kreativnosti i inovativnost. Statistički softver pojednostavljuje prezentaciju dobijenih rezultata i čini je mnogo efektnijom.
Komentari (0)