Cada vegada que un CAPTCHA et demana que identifiquis senyals de trànsit, semàfors o vehicles en una fotografia estàs entrenant a una intel·ligència artificial perquè aprengui a identificar-los en un futur. I com que una de les fites que vol resoldre la intel·ligència artificial (IA) és la de fer circular vehicles autònoms, no és cap casualitat que les escenes vinculades al trànsit siguin les que més abunden en aquests tipus de CAPTCHA.
De fet, no és una qüestió menor. Dins del procés de desenvolupament d’aquests sistemes, la part més costosa és la recopilació de les denominades datasets, és a dir, la informació o experiència que l’algorisme ha d’analitzar de forma massiva per trobar correlacions i resoldre el problema que se li planteja. Per tant, es tracta d’una informació amb un alt valor econòmic que les empreses tecnològiques estan compilant a través d’uns usuaris, nosaltres, que hi contribuïm de forma totalment inconscient i gratuïta.
En qualsevol cas, aquesta informació que hem considerat interessant explicar-vos per si no n’estaveu al corrent, ens serveix per fer una introducció a les maneres principals que tenen les IA d’aprendre i que, tal com es narra en el curs de Ciutadania.cat, són les següents:
- el raonament automàtic, que sap establir premisses i extreure conclusions raonades;
- la planificació, com la que fa Google Maps quan traça una ruta
- el machine learning o aprenentatge automàtic consisteix a analitzar grans quantitats de dades o Big Data mitjançant l’ús d’algorismes per extreure correlacions o patrons de comportaments sota diferents situacions o normes. La manera com ho fan aquests algorismes és a través de la tècnica del ‘clustering’, és a dir, agrupant objectes semblants dins d’un conjunt d’objectes desendreçats, però també mitjançant aquells algorismes de reconeixement de classes o classificadors.
Com funciona el machine learning?
El terme Machine Learning es va usar per primer cop el 1959 i ha esdevingut una disciplina del camp de la Intel·ligència Artificial que, mitjançant algoritmes, dota els ordinadors de la capacitat d’identificar patrons en dades massives i elaborar prediccions (anàlisi predictiva). Aquest aprenentatge permet als computadors fer tasques específiques de forma autònoma, és a dir, sense necessitat de ser programats.
Els seus algorismes es divideixen en tres categories:
- L’aprenentatge supervisat
Aquests algoritmes basen el seu aprenentatge en un sistema d’etiquetes associades a unes dades que els permeten prendre decisions o fer prediccions.
Exemple: un detector de correu brossa que etiqueta un correu electrònic com a correu brossa o no depenent dels patrons que ha après de l’històric de correus (remitent, paraules clau, relació text/imatges… - Aprenentatge no supervisat
Aquests algoritmes no tenen un coneixement previ. S’enfronten al caos de dades amb l’objectiu de trobar patrons que permetin organitzar-los d’alguna manera, en la línia del ‘clustering’ que comentàvem abans.
Exemple: Patrons extrets de Big Data provinent de les xarxes socials i crear campanyes de publicitat altament segmentades. - Aprenentatge per reforç
L’algorisme apren a partir de la pròpia experiència, és a dir, és capaç de prendre la millor decisió davant de diferents situacions d’acord a un procés que fa en termes assaig-error en el qual es recompensen les decisions correctes.
Exemple: Actualment s’està utilitzant en àmbits com el reconeixement facial o l’elaboració de diagnòstics mèdics.
I una darrera curiositat per si no ho sabeu. Moltes de les aplicacions en què «el joc’ és modificar la imatge de la nostra cara (afegir-hi elements dibuixats, envellir-nos, fer-nos més joves…), sabeu què fan en realitat a banda d’entretenir-nos? Exacte! Entrenar a una IA a adquirir un munt de dades sobre les característiques facials humanes per poder-ho aplicar després en dispositius de reconeixement facial.