Duomenų analizė (DA) – tai duomenų rinkinių tyrimo procesas, siekiant nustatyti tendencijas ir padaryti išvadas apie juose esančią informaciją. Vis dažniau duomenų analizė atliekama naudojant specializuotas sistemas ir programinę įrangą. Duomenų analizės technologijos ir metodai plačiai naudojami komercinėse pramonės šakose, kad organizacijos galėtų priimti labiau pagrįstus verslo sprendimus. Mokslininkai ir tyrinėtojai taip pat naudoja analizės įrankius, kad patikrintų arba paneigtų mokslinius modelius, teorijas ir hipotezes.
Duomenų analitika dažniausiai reiškia programų asortimentą – nuo pagrindinės verslo informacijos (BI), ataskaitų teikimo ir internetinio analitinio apdorojimo (OLAP) iki įvairių pažangios analizės formų. Šia prasme ji savo pobūdžiu panaši į verslo analitiką – dar vieną bendrą duomenų analizės metodų terminą. Skirtumas tas, kad pastaroji yra orientuota į verslo naudojimą, o duomenų analizė turi platesnį dėmesį. Vis dėlto platus termino vaizdas nėra universalus: kai kuriais atvejais žmonės duomenų analizę naudoja konkrečiai pažangiajai analitikai, o BI traktuoja kaip atskirą kategoriją.
Duomenų analizės iniciatyvos gali padėti įmonėms padidinti pajamas, pagerinti veiklos efektyvumą, optimizuoti rinkodaros kampanijas ir sustiprinti klientų aptarnavimo pastangas. Analizė taip pat leidžia organizacijoms greitai reaguoti į kylančias rinkos tendencijas ir įgyti konkurencinį pranašumą prieš verslo konkurentus. Tačiau galutinis duomenų analizės tikslas yra verslo našumo didinimas. Atsižvelgiant į konkrečią programą, analizuojamus duomenis gali sudaryti istoriniai įrašai arba nauja informacija, kuri buvo apdorota analizei realiuoju laiku. Be to, jis gali būti gaunamas iš įvairių vidinių sistemų ir išorinių duomenų šaltinių.
Duomenų analizės programų tipai
Aukšto lygio duomenų analizės metodikos apima tiriamąją duomenų analizę (EDA) ir patvirtinamąją duomenų analizę (CDA). EDA siekia rasti duomenų modelius ir ryšius, o CDA taiko statistinius metodus, kad nustatytų, ar hipotezės apie duomenų rinkinį yra teisingos, ar klaidingos. Duomenų analizė taip pat gali būti atskirta į kiekybinę duomenų analizę ir kokybinę duomenų analizę. Pirmoji apima skaitmeninių duomenų analizę su kiekybiškai įvertinamais kintamaisiais. Šiuos kintamuosius galima palyginti arba išmatuoti statistiškai. Kokybinis metodas yra labiau interpretuojantis – jame pagrindinis dėmesys skiriamas ne skaitmeninių duomenų, pvz., teksto, vaizdų, garso ir vaizdo įrašų, turinio, taip pat bendrų frazių, temų ir požiūrių supratimui.