[as] illuminazioni

Riconoscimento di immagini con “carta e penna”

di Anna Greco

 

a.
Un esempio di tabella delle razze canine, compilata con le caratteristiche delle razze.

Le tecniche di image recognition hanno l’obiettivo di rendere un sistema artificiale in grado di riconoscere gli oggetti all’interno di un’immagine: un esempio fra tutti è la funzione che classifica le foto nella galleria di alcuni smartphone, riconoscendone i protagonisti. Attraverso un’attività in classe, si possono individuare i punti salienti del processo di riconoscimento e provare a simularlo con “carta e penna”. L’attività descritta è presente nei lesson plan di DIG4Future (Digital competencies, Inclusion and Growth for Future Generations), un progetto Erasmus+ dedicato a migliorare le competenze digitali dei giovani tra 11 e 14 anni che vivono in aree urbane e rurali svantaggiate in Italia, Bulgaria, Grecia e Romania.

Inizialmente, il docente chiede alla classe se qualcuno ha mai sperimentato tecnologie di riconoscimento immagini e propone qualche esempio. Invita poi studenti e studentesse a ragionare su come gli umani riconoscono un’immagine: elencando i passaggi che ciascuno compie per riconoscere un soggetto, si introduce il concetto di algoritmo e quello di estrazione delle caratteristiche. Si può descrivere a questo punto il procedimento con cui un computer riconosce l’immagine, spiegando che la tecnica utilizzata per l’image recognition è quella delle reti neurali convoluzionali (vd. [as] IA in pillole), che si ispirano al funzionamento della corteccia visiva, la parte del nostro cervello che elabora le informazioni che riceviamo dagli occhi e ci permette di vedere. Il giusto algoritmo permette di “allenare” le reti neurali a riconoscere sempre meglio le immagini.

A questo punto, la classe viene suddivisa in 4 o 5 gruppi. Tutti i gruppi meno uno ricevono la fotografia di un cane, diverso per ogni gruppo, e una “tabella delle razze”, che elenca le caratteristiche di ciascuna razza di cane. Questi gruppi si occupano dell’estrazione delle caratteristiche, compilandone un elenco relativo all’immagine ricevuta secondo la tabella.

Il gruppo rimanente è quello degli “investigatori dell’IA”: ognuno dei componenti riceve una delle foto di cani fornite agli altri e compila la tabella della razza. Si leggono poi le risposte degli “investigatori” e si comparano con quelle degli altri gruppi, di cui non si conosce ancora l’immagine. Si attribuisce un punteggio di somiglianza ai gruppi, in base a quanto sono simili le proprie indicazioni con quelle di ciascuno degli “investigatori”. Il gruppo con il maggior punteggio di somiglianza rivelerà a questo punto la foto per verificare se coincida con quella descritta dagli “investigatori”. Se il procedimento ha funzionato, il cane dello studente “investigatore” dovrebbe corrispondere a quello del gruppo con il punteggio di somiglianza più alto.

Gli studenti possono discutere i risultati, ragionando su come rendere più preciso ed efficiente il processo. Il docente può introdurre infine l’idea dei database di training, spiegando come sia utile aumentare il numero di immagini da cui trarre le caratteristiche per addestrare in modo più efficiente l’IA.