Data mining vs Data Warehousing
Data Mining i Data Warehousing són tècniques molt potents i populars per analitzar dades. Els usuaris que s'inclinen cap a les estadístiques utilitzen Data Mining. Utilitzen models estadístics per buscar patrons ocults a les dades. Els miners de dades estan interessats a trobar relacions útils entre diferents elements de dades, cosa que és, finalment, rendible per a les empreses. Però, d' altra banda, els experts en dades que poden analitzar les dimensions del negoci directament solen utilitzar els magatzems de dades.
La mineria de dades també es coneix com a descobriment de coneixement a les dades (KDD). Com s'ha esmentat anteriorment, és un camp de la informàtica, que s'ocupa de l'extracció d'informació desconeguda i interessant a partir de dades en brut. A causa del creixement exponencial de les dades, especialment en àrees com les empreses, la mineria de dades s'ha convertit en una eina molt important per convertir aquesta gran riquesa de dades en intel·ligència empresarial, ja que l'extracció manual de patrons s'ha tornat aparentment impossible en les últimes dècades. Per exemple, actualment s'utilitza per a diverses aplicacions com ara anàlisi de xarxes socials, detecció de fraus i màrqueting. La mineria de dades sol tractar les quatre tasques següents: agrupació, classificació, regressió i associació. El clúster és identificar grups similars a partir de dades no estructurades. La classificació són regles d'aprenentatge que es poden aplicar a dades noves i normalment inclouran els passos següents: preprocessament de dades, disseny de models, selecció d'aprenentatge/funcions i avaluació/validació. La regressió és trobar funcions amb un error mínim per modelar les dades. I l'associació és buscar relacions entre variables. La mineria de dades s'utilitza normalment per respondre preguntes com quins són els principals productes que poden ajudar a obtenir beneficis elevats l'any vinent a Wal-Mart?
Com s'ha esmentat anteriorment, l'emmagatzematge de dades també s'utilitza per analitzar dades, però per diferents grups d'usuaris i un objectiu lleugerament diferent en ment. Per exemple, quan es tracta del sector minorista, els usuaris d'emmagatzematge de dades estan més preocupats per quins tipus de compres són populars entre els clients, de manera que els resultats de l'anàlisi poden ajudar el client millorant l'experiència del client. Però els miners de dades primer conjectuen una hipòtesi com ara quins clients compren un determinat tipus de producte i analitzen les dades per provar la hipòtesi. L'emmagatzematge de dades podria ser realitzat per un important minorista que inicialment emmagatzema les seves botigues amb les mateixes mides de productes per esbrinar més tard que les botigues de Nova York venen inventaris de mida més petita molt més ràpid que a les botigues de Chicago. Per tant, mirant aquest resultat, el minorista pot emmagatzemar la botiga de Nova York amb mides més petites en comparació amb les botigues de Chicago.
Per tant, com podeu veure clarament, aquests dos tipus d'anàlisi semblen ser de la mateixa naturalesa a simple vista. Tots dos es preocupen per augmentar els beneficis en funció de les dades històriques. Però, per descomptat, hi ha diferències clau. En termes senzills, Data Mining i Data Warehousing es dediquen a oferir diferents tipus d'anàlisi, però definitivament per a diferents tipus d'usuaris. En altres paraules, la mineria de dades busca correlacions, patrons per donar suport a una hipòtesi estadística. Però, Data Warehousing respon a una pregunta relativament més àmplia i talla les dades a partir d'aquí per reconèixer maneres de millorar en el futur.