Învățare supravegheată

Învățare supravegheată ( supravegheat de învățare în limba engleză) este o sarcină de învățare mașină care constă învețe o funcție de predicție din exemple adnotate, în loc de învățare nesupravegheata . Se face distincția între problemele de regresie și problemele de clasificare . Astfel, problemele de predicție ale unei variabile cantitative sunt considerate a fi probleme de regresie, în timp ce problemele de predicție ale unei variabile calitative sunt probleme de clasificare.

Exemplele adnotate constituie o bază de învățare, iar funcția de predicție învățată poate fi numită și „ipoteză” sau „model”. Presupunem că această bază de învățare este reprezentativă pentru o populație de eșantion mai mare și scopul metodelor de învățare supravegheate este de a generaliza bine , adică de a învăța o funcție care face predicții corecte asupra datelor care nu sunt prezente în setul de instruire.

Definiție matematică

O bază de date de formare (sau set de formare ) este un set de perechi intrare-ieșire cu și , pe care le considerăm desenate conform unei legi fixe și necunoscute, de exemplu x n urmează o lege uniformă și y n = f (x n ) + w n unde w n este un zgomot centrat. $(x_ {n}, y_ {n}) _ {{1 \ leq n \ leq N}}$ $x_ {n} \ în X$ $y_ {n} \ în Y$ $X \ ori Y$

Metoda de învățare supravegheată folosește această bază de învățare pentru a determina o estimare a f denotată g și a numit fără discriminare funcția de predicție, ipoteza sau modelul care, cu un nou input x, asociază un output g (x) . Scopul unui algoritm de învățare supravegheat este, prin urmare, să generalizeze pentru intrările necunoscute ceea ce ar putea „învăța” datorită datelor deja adnotate de experți, aceasta într-un mod „rezonabil”. Spunem că funcția de predicție învățată trebuie să aibă garanții bune în generalizare .

Există trei tipuri de probleme rezolvabile cu o metodă de învățare automată supravegheată:

${\ displaystyle Y \ subset \ mathbb {R}}$ : când rezultatul pe care dorim să îl estimăm este o valoare într-un set continuu de realități, vorbim despre o problemă de regresie . Funcția de predicție este numită apoi regresor.
$Y = \ {1, \ ldots, I \}$ : când setul de valori de ieșire este terminat , vorbim despre o problemă de clasificare , care echivalează cu atribuirea unei etichete fiecărei intrări. Funcția de predicție se numește apoi clasificator .
Când este un set de date structurate , vorbim despre o problemă de predicție structurată , care echivalează cu atribuirea unei ieșiri complexe fiecărei intrări. De exemplu, în bioinformatică problema predicției rețelelor de interacțiuni între gene poate fi considerată ca o problemă de predicție structurată în care setul posibil de ieșiri structurate este setul tuturor graficelor care modelează interacțiunile posibile. $Da$

Metode de învățare supravegheate

Aplicații

Vezi și tu

Articole similare

Bibliografie

Antoine Cornuéjols, Laurent Miclet, Yves Kodratoff, Artificial Learning: Concepts and algorithms , Eyrolles,2002( ISBN 2-212-11020-0 ) [ detaliu ediții ]
(fr) Tom M. Mitchell, Machine Learning ,1997[ detaliu ediții ]
(ro) Christopher M. Bishop, Recunoașterea modelelor și învățarea automată , Springer,2006( ISBN 0-387-31073-8 ) [ detaliu ediții ]

Note și referințe

„clasificare” este traducerea corectă a termenului englez clasificare ; „clasificarea” franceză corespunde mai degrabă grupării în engleză. A se vedea, de exemplu, BDL-ul din Quebec