Che cos'è il machine learning?
Il machine learning è un campo secondario all'interno dell'intelligenza artificiale che si occupa di algoritmi informatici in grado di migliorarsi attraverso dati di addestramento in assenza di una programmazione esplicita. È ampiamente considerato il percorso più promettente per raggiungere l’ intelligenza artificiale più simile possibile all’essere umano.
Gli algoritmi di machine learning possono essere classificati in tre categorie:
- Apprendimento con supervisione: tu fornisci le etichette e presenti gli input di esempio con gli output desiderati e consenti all'algoritmo di apprendere le regole che abbinano gli input agli output.
- Apprendimento senza supervisione: non fornisci le etichette, quindi l'algoritmo può trovare la propria struttura per l'elaborazione degli input (ad esempio, scoprendo pattern nascosti nei dati).
- Apprendimento di rinforzo: l'algoritmo interagisce ripetutamente con un ambiente dinamico con un obiettivo specifico, ad esempio vincere una partita o guidare un'auto. L'algoritmo definisce la soluzione ottimale al problema attraverso una procedura ripetuta di tentativi ed errori.
In questo articolo, forniremo una breve panoramica del machine learning e del deep learning, nonché delle differenze tra i due concetti.
Che cos'è il deep learning?
Il deep learning è una branca del machine learning che utilizza reti neurali artificiali per emulare l'intelligenza umana. Basato sul modello dei neuroni umani, il deep learning utilizza la teoria dei grafici per organizzare gli algoritmi di ponderazione in livelli di nodi e archi. Gli algoritmi di deep learning sono eccellenti per l'elaborazione di dati non strutturati come immagini o linguaggio.
Tecnicamente, per essere classificata come "profonda" ("deep"), una rete neurale deve contenere livelli nascosti tra i livelli di input e di output di un percotrone, la struttura di base di una rete neurale. Questi strati sono considerati "nascosti" perché non presentano alcuna connessione con il mondo esterno. Alcuni esempi di architetture di deep learning:
- Feed forward (FF): i dati passano in una sola direzione dal livello di input passando dai livelli nascosti fino al livello di output. Tutti i nodi sono connessi e i dati non tornano mai indietro attraverso i livelli nascosti. L'architettura FF è usata nella compressione dei dati e nell'elaborazione delle immagini di base.
- Reti neurali ricorrenti (RNN): un tipo di rete FF che aggiunge un ritardo ai livelli nascosti per consentire l'accesso alle informazioni precedenti durante un'iterazione corrente. Questo ciclo di feedback emula la memoria e rende le RNN eccellenti per l'elaborazione del linguaggio. Ne è un ottimo esempio il testo predittivo che personalizza i suggerimenti sulla base delle parole utilizzate con maggiore frequenza.
- Reti neurali convoluzionali (CNN): una convoluzione è un'operazione matematica tra due funzioni il cui risultato è una terza funzione che descrive in che modo una delle funzioni è modificata dall'altra. Utilizzate principalmente per il riconoscimento e la classificazione delle immagini, le CNN rappresentano gli "occhi" dell'AI. I livelli nascosti in una CNN agiscono come filtri matematici usando somme ponderate per identificare bordi, colori, contrasti e altri elementi di un pixel.