Indexul Dunn este o măsură a calității unei partiții a unui set de date de grupare .
Este raportul dintre distanța maximă care separă două elemente clasificate împreună și distanța minimă care separă două elemente clasificate separat.
Este un indice care nu se bazează pe o anumită distanță și, prin urmare, poate fi utilizat într-o mare varietate de situații.
O alternativă la indicele Dunn este indicele Davies-Bouldin .
Dacă observăm matricea de date, fiecare rând din care corespunde unui individ (sau observație) și fiecare coloană corespunde unui predictor (sau variabilă). Observăm numărul de indivizi și numărul de predictori:
X=(X11...Xp1⋮⋮X1NU...XpNU){\ displaystyle X = \ left ({\ begin {array} {ccc} x_ {1} ^ {1} & ... & x_ {p} ^ {1} \\\ vdots && \ vdots \\ x_ {1 } ^ {N} & ... & x_ {p} ^ {N} \\\ end {array}} \ right)}Rețineți diferența dintre indivizi și (respectiv, linie și de ). Rețineți numărul de grupuri pe care dorim să le formăm.
Un algoritm de partiționare va da o funcție de atribuire , a cărei relevanță este căutată pentru a fi evaluată de un scor. Setul de puncte aparținând unui grup este apoi dat de .
Indicele (sau scorul) lui Dunn se bazează pe punctele medii ale fiecărui grup și pe diametrul grupului .
Expresia sa va fi:
SD=min1⩽k<k′⩽Kd(μk,μk′)max1⩽k⩽KΔk{\ displaystyle S_ {D} = {\ frac {\ displaystyle \ min _ {1 \ leqslant k <k '\ leqslant K} d (\ mu _ {k}, \ mu _ {k'})} {\ displaystyle \ max _ {1 \ leqslant k \ leqslant K} \ Delta _ {k}}}} Poate varia puțin în funcție de implementări (definiția diametrului unui grup, distanța dintre centre înlocuită cu o altă distanță între grupuri ).Indicele Dunn variază între 0 (cea mai slabă clasificare) și (cea mai bună clasificare).