Învățare supravegheată
Învățare supravegheată ( supravegheat de învățare în limba engleză) este o sarcină de învățare mașină care constă învețe o funcție de predicție din exemple adnotate, în loc de învățare nesupravegheata . Se face distincția între problemele de regresie și problemele de clasificare . Astfel, problemele de predicție ale unei variabile cantitative sunt considerate a fi probleme de regresie, în timp ce problemele de predicție ale unei variabile calitative sunt probleme de clasificare.
Exemplele adnotate constituie o bază de învățare, iar funcția de predicție învățată poate fi numită și „ipoteză” sau „model”. Presupunem că această bază de învățare este reprezentativă pentru o populație de eșantion mai mare și scopul metodelor de învățare supravegheate este de a generaliza bine , adică de a învăța o funcție care face predicții corecte asupra datelor care nu sunt prezente în setul de instruire.
Definiție matematică
O bază de date de formare (sau set de formare ) este un set de perechi intrare-ieșire cu și , pe care le considerăm desenate conform unei legi fixe și necunoscute, de exemplu x n urmează o lege uniformă și y n = f (x n ) + w n unde w n este un zgomot centrat.
(Xnu,ynu)1≤nu≤NU{\ displaystyle (x_ {n}, y_ {n}) _ {1 \ leq n \ leq N}}
Xnu∈X{\ displaystyle x_ {n} \ în X}
ynu∈Da{\ displaystyle y_ {n} \ în Y}
X×Da{\ displaystyle X \ times Y}![X \ ori Y](https://wikimedia.org/api/rest_v1/media/math/render/svg/1613c1ff4b6fbfb6c80a8da83e90ad28f0ab3483)
Metoda de învățare supravegheată folosește această bază de învățare pentru a determina o estimare a f denotată g și a numit fără discriminare funcția de predicție, ipoteza sau modelul care, cu un nou input x, asociază un output g (x) . Scopul unui algoritm de învățare supravegheat este, prin urmare, să generalizeze pentru intrările necunoscute ceea ce ar putea „învăța” datorită datelor deja adnotate de experți, aceasta într-un mod „rezonabil”. Spunem că funcția de predicție învățată trebuie să aibă garanții bune în generalizare .
Există trei tipuri de probleme rezolvabile cu o metodă de învățare automată supravegheată:
-
Da⊂R{\ displaystyle Y \ subset \ mathbb {R}}
: când rezultatul pe care dorim să îl estimăm este o valoare într-un set continuu de realități, vorbim despre o problemă de regresie . Funcția de predicție este numită apoi regresor.
-
Da={1,...,Eu}{\ displaystyle Y = \ {1, \ ldots, I \}}
: când setul de valori de ieșire este terminat , vorbim despre o problemă de clasificare , care echivalează cu atribuirea unei etichete fiecărei intrări. Funcția de predicție se numește apoi clasificator .
- Când este un set de date structurate , vorbim despre o problemă de predicție structurată , care echivalează cu atribuirea unei ieșiri complexe fiecărei intrări. De exemplu, în bioinformatică problema predicției rețelelor de interacțiuni între gene poate fi considerată ca o problemă de predicție structurată în care setul posibil de ieșiri structurate este setul tuturor graficelor care modelează interacțiunile posibile.Da{\ displaystyle Y}
![Da](https://wikimedia.org/api/rest_v1/media/math/render/svg/961d67d6b454b4df2301ac571808a3538b3a6d3f)
Metode de învățare supravegheate
Aplicații
Vezi și tu
Articole similare
Bibliografie
-
Antoine Cornuéjols, Laurent Miclet, Yves Kodratoff, Artificial Learning: Concepts and algorithms , Eyrolles,2002( ISBN 2-212-11020-0 ) [ detaliu ediții ]
- (fr) Tom M. Mitchell, Machine Learning ,1997[ detaliu ediții ]
-
(ro) Christopher M. Bishop, Recunoașterea modelelor și învățarea automată , Springer,2006( ISBN 0-387-31073-8 ) [ detaliu ediții ]
Note și referințe
-
„clasificare” este traducerea corectă a termenului englez clasificare ; „clasificarea” franceză corespunde mai degrabă grupării în engleză. A se vedea, de exemplu, BDL-ul din Quebec
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">