DBMS vs Data Mining
A DBMS (Database Management System) er et komplet system, der bruges til at administrere digitale databaser, der tillader lagring af databaseindhold, oprettelse/vedligeholdelse af data, søgning og andre funktioner. På den anden side er Data Mining et felt inden for datalogi, som beskæftiger sig med udvinding af hidtil ukendt og interessant information fra rådata. Norm alt lagres de data, der bruges som input til Data mining-processen, i databaser. Brugere, der er tilbøjelige til statistik, bruger Data Mining. De bruger statistiske modeller til at lede efter skjulte mønstre i data. Dataminere er interesserede i at finde nyttige relationer mellem forskellige dataelementer, hvilket i sidste ende er rentabelt for virksomheder.
DBMS
DBMS, nogle gange bare kaldet en database manager, er en samling af computerprogrammer, der er dedikeret til styring (dvs. organisering, lagring og hentning) af alle databaser, der er installeret i et system (dvs. harddisk eller netværk). Der findes forskellige typer af databasestyringssystemer i verden, og nogle af dem er designet til korrekt styring af databaser konfigureret til specifikke formål. De mest populære kommercielle databasestyringssystemer er Oracle, DB2 og Microsoft Access. Alle disse produkter giver mulighed for tildeling af forskellige niveauer af privilegier til forskellige brugere, hvilket gør det muligt for et DBMS at blive kontrolleret centr alt af en enkelt administrator eller at blive allokeret til flere forskellige personer. Der er fire vigtige elementer i ethvert databasestyringssystem. De er modelleringssproget, datastrukturerne, forespørgselssproget og mekanismen for transaktioner. Modelleringssproget definerer sproget for hver database, der er hostet i DBMS. I øjeblikket er flere populære tilgange som hierarkisk, netværk, relationel og objekt i praksis. Datastrukturer hjælper med at organisere dataene såsom individuelle poster, filer, felter og deres definitioner og objekter såsom visuelle medier. Dataforespørgselssprog opretholder databasens sikkerhed ved at overvåge logindata, adgangsrettigheder til forskellige brugere og protokoller til at tilføje data til systemet. SQL er et populært forespørgselssprog, der bruges i relationelle databasestyringssystemer. Endelig hjælper mekanismen, der muliggør transaktioner, samtidighed og mangfoldighed. Denne mekanisme vil sikre, at den samme registrering ikke bliver ændret af flere brugere på samme tid, og dermed holde dataintegriteten intakt. Derudover giver DBMS også backup og andre faciliteter.
Data Mining
Datamining er også kendt som Knowledge Discovery in Data (KDD). Som nævnt ovenfor er det en felid inden for datalogi, som beskæftiger sig med udvinding af hidtil ukendte og interessante informationer fra rådata. På grund af den eksponentielle vækst af data, især inden for områder som erhvervslivet, er datamining blevet et meget vigtigt værktøj til at konvertere denne store datarigdom til business intelligence, da manuel udtrækning af mønstre er blevet tilsyneladende umulig i de sidste par årtier. For eksempel er det i øjeblikket blevet brugt til forskellige applikationer såsom sociale netværksanalyse, svindeldetektion og markedsføring. Data mining beskæftiger sig norm alt med følgende fire opgaver: clustering, klassificering, regression og association. Clustering er at identificere lignende grupper ud fra ustrukturerede data. Klassifikation er læringsregler, der kan anvendes på nye data og vil typisk omfatte følgende trin: forbehandling af data, design af modellering, læring/funktionsvalg og evaluering/validering. Regression er at finde funktioner med minimal fejl til at modellere data. Og association leder efter sammenhænge mellem variabler. Data mining bruges norm alt til at besvare spørgsmål som hvad er de vigtigste produkter, der kan hjælpe med at opnå høj fortjeneste næste år i Wal-Mart?
Hvad er forskellen mellem DBMS og Data mining?
DBMS er et fuldgyldigt system til at huse og administrere et sæt digitale databaser. Datamining er dog en teknik eller et koncept inden for datalogi, som beskæftiger sig med at udtrække nyttig og hidtil ukendt information fra rådata. De fleste gange er disse rådata gemt i meget store databaser. Derfor bruger dataminere de eksisterende funktioner i DBMS til at håndtere, administrere og endda forbehandle rådata før og under dataudvindingsprocessen. Et DBMS-system alene kan dog ikke bruges til at analysere data. Men nogle DBMS har i øjeblikket indbyggede dataanalyseværktøjer eller -funktioner.