Estructurat versus no estructurat
Estructurat i No estructurat són dos tipus de dades o informació que mostren diferències entre ells pel que fa als seus conceptes i significats. La descripció de les dades contingudes en camps és el que s'anomena informació estructurada. D' altra banda, tots els documents binaris reben el nom d'informació o dades no estructurades. Aquesta és la diferència principal entre l'estructurat i el no estructurat.
La informació estructurada s'anomena així, perquè la seva naturalesa i funció s'identifiquen mitjançant etiquetes de metadades. D' altra banda, alguns dels millors exemples dels documents que pertanyen al tipus de dades o informació no estructurada són.pdf i.docx.
És important saber que la informació estructurada té molt a veure amb SharePoint. Es diu que tot el contingut produït o creat directament a o dins de SharePoint es considera de naturalesa estructurada. Per exemple, tots els llistats d'àrea i els elements de llista que es creen o es produeixen directament a SharePoint es troben sota el tipus de dades o informació estructurada. Aquesta és una observació important a fer quan es tracta de definir dades estructurades.
Cal recordar que tots els documents binaris que utilitzen aplicacions pròpies com Acrobat o Word es troben sota el tipus de dades o informació no estructurada. De fet, la informació no estructurada s'extreu automàticament mitjançant l'aplicació d'IFilter o el convertidor corresponent. Aquesta és una altra diferència important entre les dades estructurades i les no estructurades.
Per descomptat, cal recordar que les referències de SharePoint s'utilitzen principalment només per indexar les dades estructurades. No s'utilitza per a cap altre propòsit. Una comprensió clara de la diferència entre dades o informació estructurada i no estructurada és absolutament essencial per a l'expert en programari en el sentit que estarà en condicions de classificar correctament els fitxers i les dades.