Trendovi u razvoju statističkog softvera

Razvoj statističkog softvera je uslovljen statističkom praksom, ali isto tako postoji i povratni uticaj razvoja informacione tehnologije na statistiku.

Prva generacija statističkih paketa javlja se 1960-tih godina. Ovi paketi su bili usmereni ka agregaciji, tj. redukciji podataka. Korisnik je imao malo izbora, a obrada je bila paketna. Naglasak je u tom periodu bio na numeričkoj preciznosti. Kasne šezdesete su počele da menjaju ove pretpostavke.

Do kraja 1970-tih se razvila dijagnostika podataka i generalizacija klasičnih modela, a počeli su da se razvijaju i grafički metodi. Interaktivni programi su u to vreme postojali, ali su ih statističari sporo prihvatali.

Veliki napredak se desio na metodima koji zahtevaju intenzivno računanje tokom 1980-tih godina. Tehnike re-uzorkovanja i polu-parametrijski modeli su uklonili okove linearnih modela i normalne teorije. Razvijene su dinamičke grafičke tehnike koje su rukovale sve složenijim podacima.

Mogućnosti statističkog softvera su polako napredovale od redukcije ka produkciji podataka. Širila se i oblast primene statističkog softvera. Statističari su se složili da su alternativna formulacija modela, dijagnostika, grafika i dr. neophodni za valjanu analizu podataka.

Neiskusni korisnici statističkog softvera su u tom periodu bili zanemareni. Inicijalni napori da se statističke ekspertize uključe u softver su imale za cilj da pomognu neiskusnim korisnicima da se snađu u džungli koja je nastala. Međutim, u to vreme još uvek nisu bili razvijeni metodi koji bi ove napore učinili praktičnim. Tipičan dizajn softvera je omogućavao pozadinsku dijagnostiku i izveštavanje samo o neuspešnim proverama, a samo ponekad i sa naznakom mera koje je potrebno preduzeti da bi se problem rešio.

U načelu, ideje usmerene ka uključivanju ekspertize u statističke programe nisu naišle na mnogo entuzijazma u statističkoj zajednici. Najveći kritičari uključivanju ekspertize su upozoravali na nemogućnost automatizacije “umetnosti” analize podatka. Jedan od problema izrade pametnog statističkog softvera je i odsustvo želje statističara da ga naprave, jer im je lakše da pišu knjige.

Kasniji napredak u razvoju statističkih paketa bi se mogao sažeti kao:

integracija statističke ekspertize u statističke programe,
upravljanje velikim skupovima podataka,
implementacija novih algoritama koju je omogućila velika ekspanzija računarske snage.

Statistička ekspertiza treba da bude uključena u softver iz najmanje tri razloga:

omogućavanje bolje analize ne-statističarima, kako bi im se pružila pomoć u korišćenju onih tehnika koje statističari smatraju korisnim,
stimulacija razvoja boljeg softverskog okruženja za statističare,
studiranje samog procesa analize podataka.

Softver sa statističkom ekspertizom je namenjen pre svega povremenim korisnicima koji žele aktivne sisteme, sisteme koji preuzimaju kontrolu. Oni žele black-box model. S druge strane, profesionalni statističari žele pasivne sisteme, sisteme koji rade po komandi.

Potreba za obradom velikog skupa podataka pojavila se pre svega kao posledica razvoja računarske snage i interneta. Postalo je moguće prikupljanje i skladištenje ogromne količine podataka, a tržišni trendovi su išli u pravcu personalizacije podataka o korisnicima usluga koja je zahtevala mnoštvo podataka o svakom pojedincu ili prikupljanje i obradu velikog broja relevantnih finansijskih i drugih informacija iz preduzeća i njegovog okruženja. Velika količina podataka postavlja izazove pred statističare, kako tehničke tako i metodološke prirode. Zato je bio potreban novi, multidisciplinarni pristup koji je povezao oblasti statistike sa oblastima baza podataka i raznih matematičkih teorija, a sve bazirano na inovativnim konceptima organizacije informaciono-komunikacione tehnike i jačanju snage hardvera.

Jedna od najpoznatijih tehnika koja je nastala kao posledica ovog trenda je rudarenje podataka (engl. data mining). To je proces u kojem se podaci analiziraju iz različitih perspektiva i agregiraju u korisne informacije. Softver za rudarenje podataka omogućava analizu više različitih dimenzija podataka, njihovu kategorizaciju i agregaciju identifikovanih relacija. Sa statističkog aspekta, radi se o pronalaženju korelacija ili obrazaca između velikog broja varijabli (kolona) u velikim relacionim bazama podataka.

Pojava i širenje statističkog softvera je nesumnjivo veoma mnogo doprinela razvoju istraživačkih studija u 21 veku. Statistički softver je glavni alat za istraživačku analizu, validaciju podataka i prezentaciju rezultata istraživanja.

Statistički softver omogućava istraživačima da se oslobode rutinskih matematičkih grešaka i da proizvedu tačne rezultate u svojim istraživanjima, pod uslovom da su uneli tačne podatke. Razvoj statističkog softvera omogućio je više kvantitativnih studija, a istraživači, profesionalci, naučnici i menadžeri mogu mnogo jasnije da predstave tačna predviđanja budućnosti koristeći mogućnosti savremenog statističkog softvera.

Napredak statističkog sotvera je omogućio i poboljšanje kvaliteta istraživačkih studija. Bilo koje kvantitativno istraživanje je nemoguće sprovesti bez statističkog softvera. Šta više, on omogućava profesionalcima interakciju sa podacima, štedeći vreme i oslobađajući prostor za kreativnosti i inovativnost. Statistički softver pojednostavljuje prezentaciju dobijenih rezultata i čini je mnogo efektnijom.

Trendovi u razvoju statističkog softvera

Vaš komentar

Komentari (0)

Najčitaniji tekstovi

Današnja reč

parametar

Najnoviji tekstovi

Najbolji tekstovi