Base de dades distribuïda versus base de dades centralitzada
La base de dades centralitzada és una base de dades en què les dades s'emmagatzemen i es mantenen en una única ubicació. Aquest és l'enfocament tradicional per emmagatzemar dades a les grans empreses. La base de dades distribuïda és una base de dades en què les dades s'emmagatzemen en dispositius d'emmagatzematge que no es troben a la mateixa ubicació física però que la base de dades es controla mitjançant un sistema central de gestió de bases de dades (DBMS).
Què és la base de dades centralitzada?
En una base de dades centralitzada, totes les dades d'una organització s'emmagatzemen en un sol lloc, com ara un ordinador central o un servidor. Els usuaris d'ubicacions remotes accedeixen a les dades a través de la xarxa d'àrea àmplia (WAN) mitjançant els programes d'aplicació proporcionats per accedir a les dades. La base de dades centralitzada (el mainframe o el servidor) hauria de ser capaç de satisfer totes les sol·licituds que arribin al sistema, per tant podria convertir-se fàcilment en un coll d'ampolla. Però com que totes les dades es troben en un sol lloc, és més fàcil mantenir i fer una còpia de seguretat de les dades. A més, és més fàcil mantenir la integritat de les dades, perquè una vegada que les dades s'emmagatzemen en una base de dades centralitzada, les dades obsoletes ja no estan disponibles en altres llocs.
Què és la base de dades distribuïda?
En una base de dades distribuïda, les dades s'emmagatzemen en dispositius d'emmagatzematge que es troben en diferents ubicacions físiques. No estan connectats a una CPU comuna, però la base de dades està controlada per un SGBD central. Els usuaris accedeixen a les dades en una base de dades distribuïda accedint a la WAN. Per mantenir una base de dades distribuïda actualitzada, utilitza els processos de replicació i duplicació. El procés de replicació identifica els canvis a la base de dades distribuïda i aplica aquests canvis per assegurar-se que totes les bases de dades distribuïdes semblen iguals. Depenent del nombre de bases de dades distribuïdes, aquest procés pot arribar a ser molt complex i consumir molt de temps. El procés de duplicació identifica una base de dades com a base de dades mestra i la duplica. Aquest procés no és complicat com el procés de replicació, però s'assegura que totes les bases de dades distribuïdes tinguin les mateixes dades.
Quina diferència hi ha entre la base de dades distribuïda i la base de dades centralitzada?
Mentre una base de dades centralitzada conserva les seves dades en dispositius d'emmagatzematge que es troben en una única ubicació connectada a una única CPU, un sistema de bases de dades distribuïdes conserva les seves dades en dispositius d'emmagatzematge que possiblement es troben en diferents ubicacions geogràfiques i gestionats mitjançant una central DBMS. Una base de dades centralitzada és més fàcil de mantenir i mantenir actualitzada, ja que totes les dades s'emmagatzemen en una única ubicació. A més, és més fàcil mantenir la integritat de les dades i evitar la necessitat de duplicar les dades. Però, totes les sol·licituds que arriben per accedir a les dades són processades per una sola entitat, com ara un únic mainframe, i per tant podria convertir-se fàcilment en un coll d'ampolla. Però amb les bases de dades distribuïdes, aquest coll d'ampolla es pot evitar ja que les bases de dades estan paral·lelitzades fent que la càrrega s'equilibri entre diversos servidors. Però mantenir les dades actualitzades al sistema de bases de dades distribuïdes requereix treball addicional, per tant augmenta el cost de manteniment i la complexitat i també requereix programari addicional per a aquest propòsit. A més, dissenyar bases de dades per a una base de dades distribuïda és més complex que per a una base de dades centralitzada.