Forskellen mellem data mining og data warehousing

Forskellen mellem data mining og data warehousing
Forskellen mellem data mining og data warehousing

Video: Forskellen mellem data mining og data warehousing

Video: Forskellen mellem data mining og data warehousing
Video: HTС WildFire S. Второй пожар ярче 2024, Juli
Anonim

Datamining vs Data Warehousing

Data Mining og Data Warehousing er både meget kraftfulde og populære teknikker til at analysere data. Brugere, der er tilbøjelige til statistik, bruger Data Mining. De bruger statistiske modeller til at lede efter skjulte mønstre i data. Dataminere er interesserede i at finde nyttige relationer mellem forskellige dataelementer, hvilket i sidste ende er rentabelt for virksomheder. Men på den anden side har dataeksperter, der kan analysere dimensioner af virksomheden direkte, en tendens til at bruge datavarehuse.

Datamining er også kendt som Knowledge Discovery in data (KDD). Som nævnt ovenfor er det et felt inden for datalogi, som beskæftiger sig med udvinding af hidtil ukendte og interessante informationer fra rådata. På grund af den eksponentielle vækst af data, især inden for områder som erhvervslivet, er datamining blevet et meget vigtigt værktøj til at konvertere denne store datarigdom til business intelligence, da manuel udtrækning af mønstre er blevet tilsyneladende umulig i de sidste par årtier. For eksempel er det i øjeblikket blevet brugt til forskellige applikationer såsom sociale netværksanalyse, svindeldetektion og markedsføring. Data mining beskæftiger sig norm alt med følgende fire opgaver: clustering, klassificering, regression og association. Clustering er at identificere lignende grupper ud fra ustrukturerede data. Klassifikation er læringsregler, der kan anvendes på nye data og vil typisk omfatte følgende trin: forbehandling af data, design af modellering, læring/funktionsvalg og evaluering/validering. Regression er at finde funktioner med minimal fejl til at modellere data. Og association leder efter sammenhænge mellem variabler. Data mining bruges norm alt til at besvare spørgsmål som hvad er de vigtigste produkter, der kan hjælpe med at opnå høj fortjeneste næste år i Wal-Mart?

Som nævnt ovenfor bruges Data warehousing også til at analysere data, men af forskellige brugersæt og et lidt andet mål for øje. Når det for eksempel kommer til detailsektoren, er data warehousing-brugere mere optaget af, hvilke typer køb der er populære blandt kunderne, så resultaterne af analysen kan hjælpe kunden ved at forbedre kundeoplevelsen. Men dataminere antager først en hypotese, såsom hvilke kunder der køber en bestemt type produkt og analyserer dataene for at teste hypotesen. Data warehousing kunne udføres af en større detailhandler, der i første omgang lagerfører sine butikker med samme størrelser af produkter for senere at finde ud af, at New York-butikker sælger mindre lagerbeholdninger meget hurtigere end i Chicago-butikker. Så ved at se på dette resultat kan forhandleren lagerføre New York-butikken med mindre størrelser sammenlignet med Chicago-butikker.

Så, som du tydeligt kan se, ser disse to typer analyser ud til at være af samme karakter med det blotte øje. Begge bekymrer sig om at øge overskuddet baseret på de historiske data. Men selvfølgelig er der vigtige forskelle. Enkelt sagt er Data Mining og Data Warehousing dedikeret til at levere forskellige typer analyser, men bestemt til forskellige typer brugere. Med andre ord leder Data Mining efter korrelationer, mønstre for at understøtte en statistisk hypotese. Men Data Warehousing besvarer et forholdsvis bredere spørgsmål, og det opskærer og skærer data derfra og frem for at genkende måder til forbedringer i fremtiden.

Anbefalede: