În învățarea automată , nucleul polinomial este o funcție de nucleu utilizată în mod obișnuit cu mașinile de suport vector (SVM) și alte modele de nucleu . Reprezintă similaritatea vectorilor (eșantioane de antrenament) într-un spațiu de grad polinomial mai mare decât cel al variabilelor originale, ceea ce permite antrenarea modelelor neliniare.
Intuitiv, nucleul polinomial ia în considerare nu numai proprietățile eșantioanelor de intrare pentru a determina similitudinea lor, ci și combinațiile acestora. În contextul analizei de regresie , astfel de combinații sunt cunoscute ca trăsături de interacțiune. Spațiul caracteristic (implicit) al unui nucleu polinomial este echivalent cu cel al regresiei polinomiale , dar fără explozia combinatorie a numărului de parametri care trebuie învățați. Când caracteristicile de intrare sunt valori binare (booleene), atunci caracteristicile corespund conjuncției logice a caracteristicilor de intrare.
Pentru un polinom de grad d , nucleul polinomial este definit ca:
unde x și y sunt vectori în spațiul de intrare , adică vectori de caracteristici calculate din eșantioane de testare sau de testare, și c ≥ 0 este un parametru liber care echilibrează influența termenilor de ordin superior față de termenii de ordin inferior din polinom. Când c = 0 , nucleul este numit omogen. (Un nucleu polinomial mai generalizat împarte x T y de un parametru scalar este specificat de utilizator.)
Ca nucleu, K corespunde unui produs punct într-un spațiu caracteristic bazat pe o anumită hartă Φ :
Natura Φ poate fi văzută dintr-un exemplu. Fie d = 2 , obținem astfel cazul particular al nucleului pătratic. După utilizarea teoremei multinomiale a lui Newton (de două ori aplicația externă este teorema binomială a lui Newton ) și grupare,
rezultă că funcționalitatea aplicației este dată de:
Deși nucleul RBF este mai popular în clasificarea SVM decât nucleul polinomial, acesta din urmă este foarte popular în procesarea limbajului natural (NLP). Cel mai frecvent grad este d = 2 (pătratic), deoarece gradele mari tind să învețe prea mult despre problemele NLP.
Diferite moduri de calculare a nucleului polinomial (atât exact cât și aproximativ) au fost concepute ca alternative la utilizarea algoritmilor de formare neliniară SVM, inclusiv:
O problemă cu nucleul polinomial este că poate suferi de instabilitate numerică : când x T y + c <1, K ( x , y ) = ( x T y + c ) d se apropie de zero cu creșterea d , în timp ce când x T y + c > 1, K ( x , y ) tinde spre infinit.