Forskellen mellem Data Mining og OLAP

Forskellen mellem Data Mining og OLAP
Forskellen mellem Data Mining og OLAP

Video: Forskellen mellem Data Mining og OLAP

Video: Forskellen mellem Data Mining og OLAP
Video: A tale of two brains. - Et eventyr om 2 hjerner. 2024, November
Anonim

Data Mining vs OLAP

Både datamining og OLAP er to af de almindelige Business Intelligence-teknologier (BI). Business intelligence refererer til computerbaserede metoder til at identificere og udtrække nyttig information fra forretningsdata. Data mining er feltet inden for datalogi, som beskæftiger sig med at udvinde interessante mønstre fra store datasæt. Den kombinerer mange metoder fra kunstig intelligens, statistik og databasestyring. OLAP (online analytical processing), som navnet antyder, er en samling af måder at forespørge multidimensionelle databaser på.

Datamining er også kendt som Knowledge Discovery in data (KDD). Som nævnt ovenfor er det et felt inden for datalogi, som beskæftiger sig med udvinding af hidtil ukendte og interessante informationer fra rådata. På grund af den eksponentielle vækst af data, især inden for områder som erhvervslivet, er datamining blevet et meget vigtigt værktøj til at konvertere denne store datarigdom til business intelligence, da manuel udtrækning af mønstre er blevet tilsyneladende umulig i de sidste par årtier. For eksempel er det i øjeblikket blevet brugt til forskellige applikationer såsom sociale netværksanalyse, svindeldetektion og markedsføring. Data mining beskæftiger sig norm alt med følgende fire opgaver: clustering, klassificering, regression og association. Clustering er at identificere lignende grupper ud fra ustrukturerede data. Klassifikation er læringsregler, der kan anvendes på nye data og vil typisk omfatte følgende trin: forbehandling af data, design af modellering, læring/funktionsvalg og evaluering/validering. Regression er at finde funktioner med minimal fejl til at modellere data. Og association leder efter sammenhænge mellem variabler. Data mining bruges norm alt til at besvare spørgsmål som, hvad er de vigtigste produkter, der kan hjælpe med at opnå høj fortjeneste næste år i Wal-Mart.

OLAP er en klasse af systemer, som giver svar på multidimensionelle forespørgsler. Typisk bruges OLAP til marketing, budgettering, prognoser og lignende applikationer. Det siger sig selv, at de databaser, der bruges til OLAP, er konfigureret til komplekse og ad hoc-forespørgsler med en hurtig ydeevne i tankerne. Typisk bruges en matrix til at vise output fra en OLAP. Rækkerne og kolonnerne er dannet af forespørgslens dimensioner. De bruger ofte metoder til aggregering på flere tabeller for at opnå oversigter. For eksempel kan det bruges til at finde ud af salget af dette år i Wal-Mart sammenlignet med sidste år? Hvad er forudsigelsen om salget i det næste kvartal? Hvad kan man sige om tendensen ved at se på den procentvise ændring?

Selvom det er indlysende, at Data mining og OLAP ligner hinanden, fordi de opererer på data for at opnå intelligens, kommer den største forskel fra, hvordan de opererer på data. OLAP-værktøjer giver multidimensionel dataanalyse, og de giver opsummeringer af dataene, men i modsætning hertil fokuserer data mining på forhold, mønstre og påvirkninger i datasættet. Det er en OLAP-aftale med aggregering, som koger ned til driften af data via "addition", men data mining svarer til "division". En anden bemærkelsesværdig forskel er, at mens dataminingværktøjer modellerer data og returnerer handlingsrettede regler, vil OLAP udføre sammenlignings- og kontrastteknikker langs forretningsdimensionen i re altid.

Anbefalede: