Data Mining vs OLAP
Tant la mineria de dades com OLAP són dues de les tecnologies comunes d'intel·ligència empresarial (BI). La intel·ligència empresarial fa referència als mètodes basats en ordinador per identificar i extreure informació útil de les dades empresarials. La mineria de dades és el camp de la informàtica que s'ocupa d'extreure patrons interessants a partir de grans conjunts de dades. Combina molts mètodes d'intel·ligència artificial, estadístiques i gestió de bases de dades. OLAP (processament analític en línia), com el seu nom indica, és una recopilació de maneres de consultar bases de dades multidimensionals.
La mineria de dades també es coneix com a descobriment de coneixement a les dades (KDD). Com s'ha esmentat anteriorment, és un camp de la informàtica, que s'ocupa de l'extracció d'informació desconeguda i interessant a partir de dades en brut. A causa del creixement exponencial de les dades, especialment en àrees com les empreses, la mineria de dades s'ha convertit en una eina molt important per convertir aquesta gran riquesa de dades en intel·ligència empresarial, ja que l'extracció manual de patrons s'ha tornat aparentment impossible en les últimes dècades. Per exemple, actualment s'utilitza per a diverses aplicacions com ara anàlisi de xarxes socials, detecció de fraus i màrqueting. La mineria de dades sol tractar les quatre tasques següents: agrupació, classificació, regressió i associació. El clúster és identificar grups similars a partir de dades no estructurades. La classificació és regles d'aprenentatge que es poden aplicar a dades noves i que normalment inclouran els passos següents: preprocessament de dades, modelatge de disseny, selecció d'aprenentatge/funcions i avaluació/validació. La regressió és trobar funcions amb un error mínim per modelar les dades. I l'associació és buscar relacions entre variables. La mineria de dades s'utilitza normalment per respondre preguntes com quins són els principals productes que poden ajudar a obtenir beneficis elevats l'any vinent a Wal-Mart.
OLAP és una classe de sistemes que ofereixen respostes a consultes multidimensionals. Normalment OLAP s'utilitza per a aplicacions de màrqueting, pressupostos, previsions i similars. No cal dir que les bases de dades utilitzades per a OLAP estan configurades per a consultes complexes i ad-hoc amb un rendiment ràpid en ment. Normalment s'utilitza una matriu per mostrar la sortida d'un OLAP. Les files i columnes estan formades per les dimensions de la consulta. Sovint utilitzen mètodes d'agregació en múltiples taules per obtenir resums. Per exemple, es pot utilitzar per conèixer les vendes d'aquest any a Wal-Mart en comparació amb l'any passat? Quina és la previsió de vendes per al proper trimestre? Què es pot dir de la tendència observant el canvi percentual?
Tot i que és obvi que la mineria de dades i l'OLAP són similars perquè operen amb dades per obtenir intel·ligència, la diferència principal prové de com operen amb les dades. Les eines OLAP ofereixen anàlisis de dades multidimensionals i proporcionen resums de les dades, però en canvi, la mineria de dades se centra en les proporcions, patrons i influències en el conjunt de dades. Es tracta d'un acord OLAP amb agregació, que es redueix a l'operació de dades mitjançant "addició", però la mineria de dades correspon a la "divisió". Una altra diferència notable és que, mentre que les eines de mineria de dades modelen dades i retornen regles accionables, OLAP realitzarà tècniques de comparació i contrast en la dimensió empresarial en temps real..