Diferència clau: aprenentatge automàtic supervisat i no supervisat
L'aprenentatge supervisat i l'aprenentatge no supervisat són dos conceptes bàsics de l'aprenentatge automàtic. L'aprenentatge supervisat és una tasca d'aprenentatge automàtic d'aprenentatge d'una funció que mapeja una entrada a una sortida basada en els exemples de parells d'entrada-sortida. L'aprenentatge no supervisat és la tasca d'aprenentatge automàtic d'inferir una funció per descriure l'estructura oculta a partir de dades sense etiquetar. La diferència clau entre l'aprenentatge automàtic supervisat i no supervisat és que l'aprenentatge supervisat utilitza dades etiquetades mentre que l'aprenentatge no supervisat utilitza dades sense etiqueta.
L'aprenentatge automàtic és un camp de la informàtica que permet que un sistema informàtic aprengui a partir de dades sense ser programat explícitament. Permet analitzar les dades i predir-hi patrons. Hi ha moltes aplicacions de l'aprenentatge automàtic. Alguns d'ells són el reconeixement facial, el reconeixement de gestos i el reconeixement de parla. Hi ha diversos algorismes relacionats amb l'aprenentatge automàtic. Alguns d'ells són regressió, classificació i agrupació. Els llenguatges de programació més comuns per desenvolupar aplicacions basades en l'aprenentatge automàtic són R i Python. També es poden utilitzar altres llenguatges com Java, C++ i Matlab.
Què és l'aprenentatge supervisat?
En els sistemes basats en l'aprenentatge automàtic, el model funciona segons un algorisme. En l'aprenentatge supervisat, el model és supervisat. En primer lloc, cal entrenar el model. Amb els coneixements adquirits, pot predir respostes per a casos futurs. El model s'entrena mitjançant un conjunt de dades etiquetat. Quan es donen dades fora de la mostra al sistema, aquest pot predir el resultat. A continuació es mostra un petit extracte del popular conjunt de dades IRIS.
Segons la taula anterior, la longitud del sèpal, l'amplada del sèpal, la longitud del patel, l'amplada del patel i les espècies s'anomenen atributs. Les columnes es coneixen com a característiques. Una fila té dades per a tots els atributs. Per tant, una fila s'anomena observació. Les dades poden ser numèriques o categòriques. El model rep les observacions amb el nom de l'espècie corresponent com a entrada. Quan es fa una nova observació, el model hauria de predir el tipus d'espècie a la qual pertany.
En l'aprenentatge supervisat, hi ha algorismes per a la classificació i la regressió. La classificació és el procés de classificació de les dades etiquetades. El model va crear límits que separaven les categories de dades. Quan es proporcionen dades noves al model, es pot classificar en funció d'on existeix el punt. El K-Nearest Neighbours (KNN) és un model de classificació. En funció del valor k, es decideix la categoria. Per exemple, quan k és 5, si un punt de dades concret és a prop de vuit punts de dades de la categoria A i sis punts de dades de la categoria B, el punt de dades es classificarà com a A.
La regressió és el procés de predir la tendència de les dades anteriors per predir el resultat de les noves dades. En regressió, la sortida pot consistir en una o més variables contínues. La predicció es fa mitjançant una línia que cobreix la majoria dels punts de dades. El model de regressió més senzill és una regressió lineal. És ràpid i no requereix paràmetres de sintonització com ara KNN. Si les dades mostren una tendència parabòlica, aleshores el model de regressió lineal no és adequat.
Aquests són alguns exemples d'algoritmes d'aprenentatge supervisat. En general, els resultats generats a partir dels mètodes d'aprenentatge supervisat són més precisos i fiables perquè les dades d'entrada són ben conegudes i etiquetades. Per tant, la màquina només ha d'analitzar els patrons ocults.
Què és l'aprenentatge no supervisat?
En l'aprenentatge no supervisat, el model no està supervisat. El model funciona per si mateix per predir els resultats. Utilitza algorismes d'aprenentatge automàtic per arribar a conclusions sobre dades sense etiquetar. En general, els algorismes d'aprenentatge no supervisat són més difícils que els algorismes d'aprenentatge supervisat perquè hi ha poca informació. El clúster és un tipus d'aprenentatge no supervisat. Es pot utilitzar per agrupar les dades desconegudes mitjançant algorismes. La k-mean i la agrupació basada en la densitat són dos algorismes de agrupació.
Algorisme k-mean, col·loca k centroide aleatòriament per a cada clúster. A continuació, cada punt de dades s'assigna al centroide més proper. La distància euclidiana s'utilitza per calcular la distància des del punt de dades fins al centroide. Els punts de dades es classifiquen en grups. Es tornen a calcular les posicions de k centroides. La nova posició del centroide ve determinada per la mitjana de tots els punts del grup. De nou, cada punt de dades s'assigna al centroide més proper. Aquest procés es repeteix fins que els centroides ja no canvien. k-mean és un algorisme d'agrupament ràpid, però no hi ha cap inicialització especificada dels punts d'agrupació. A més, hi ha una gran variació de models d'agrupació basats en la inicialització de punts de clúster.
Un altre algorisme d'agrupació és l'agrupació basada en la densitat. També es coneix com a aplicacions de clúster espacial basades en densitat amb soroll. Funciona definint un clúster com el conjunt màxim de punts connectats de densitat. Són dos paràmetres utilitzats per a la agrupació basada en la densitat. Són Ɛ (èpsilon) i punts mínims. El Ɛ és el radi màxim del barri. Els punts mínims són el nombre mínim de punts al barri Ɛ per definir un clúster. Aquests són alguns exemples d'agrupaments que es troben en l'aprenentatge no supervisat.
En general, els resultats generats a partir dels algorismes d'aprenentatge no supervisat no són gaire precisos i fiables perquè la màquina ha de definir i etiquetar les dades d'entrada abans de determinar els patrons i funcions ocults.
Quina semblança hi ha entre l'aprenentatge automàtic supervisat i no supervisat?
Tant l'aprenentatge supervisat com l'aprenentatge no supervisat són tipus d'aprenentatge automàtic
Quina diferència hi ha entre l'aprenentatge automàtic supervisat i no supervisat?
Aprenentatge automàtic supervisat i no supervisat |
|
L'aprenentatge supervisat és la tasca d'aprenentatge automàtic d'aprendre una funció que assigna una entrada a una sortida basada en exemples de parells d'entrada-sortida. | L'aprenentatge no supervisat és la tasca d'aprenentatge automàtic d'inferir una funció per descriure l'estructura oculta a partir de dades sense etiquetar. |
Funció principal | |
En l'aprenentatge supervisat, el model prediu el resultat a partir de les dades d'entrada etiquetades. | En l'aprenentatge no supervisat, el model prediu el resultat sense dades etiquetades mitjançant la identificació dels patrons per si mateix. |
Precisió dels resultats | |
Els resultats generats a partir dels mètodes d'aprenentatge supervisat són més precisos i fiables. | Els resultats generats amb mètodes d'aprenentatge no supervisats no són gaire precisos i fiables. |
Algoritmes principals | |
Hi ha algorismes per a la regressió i la classificació en l'aprenentatge supervisat. | Hi ha algorismes per agrupar-los en l'aprenentatge no supervisat. |
Resum: aprenentatge automàtic supervisat i no supervisat
L'aprenentatge supervisat i l'aprenentatge no supervisat són dos tipus d'aprenentatge automàtic. L'aprenentatge supervisat és la tasca d'aprenentatge automàtic d'aprendre una funció que assigna una entrada a una sortida basada en exemples de parells d'entrada-sortida. L'aprenentatge no supervisat és la tasca d'aprenentatge automàtic d'inferir una funció per descriure l'estructura oculta a partir de dades sense etiquetar. La diferència entre l'aprenentatge automàtic supervisat i no supervisat és que l'aprenentatge supervisat utilitza dades etiquetades mentre que l'aprenentatge no supervisat utilitza dades sense etiqueta.