Distanța de la Bhattacharyya
În statistici , distanța Bhattacharyya este o măsură a similarității a două distribuții de probabilitate discrete. Este legat de coeficientul Bhattacharyya , care este o măsură statistică a suprapunerii a două seturi de probe . Această valoare este cel mai frecvent utilizată pentru potrivirea între două observații pe baza histogramei de culoare. Această măsurare este utilizată în mod regulat în probleme de clasificare , în special în domeniul viziunii pe computer .
Numele distanței și al coeficientului provin de la statisticianul indian A. Bhattacharya (ro) , care a lucrat în anii 1930 la Institutul Indian de Statistică . Coeficientul poate fi utilizat pentru a determina apropierea relativă a celor două seturi luate în considerare. Se utilizează pentru a măsura separabilitatea claselor în clasificarea automată .
Definiție
Pentru două distribuții de probabilitate discrete p și q definite pe același spațiu de probabilitate , distanța Bhattacharyya este calculată prin:
DB(p,q)=-ln(BVS(p,q)){\ displaystyle D_ {B} (p, q) = - \ ln \ left (BC (p, q) \ right)}sau:
BVS(p,q)=∑X∈Xp(X)q(X){\ displaystyle BC (p, q) = \ sum _ {x \ in X} {\ sqrt {p (x) q (x)}}}este coeficientul Bhattacharyya.
Pentru distribuții de probabilitate continue, coeficientul este definit de:
BVS(p,q)=∫p(X)q(X)dX{\ displaystyle BC (p, q) = \ int {\ sqrt {p (x) q (x)}} \, dx}În ambele cazuri și . Distanța Bhattacharyya nu respectă inegalitatea triunghiulară , spre deosebire de distanța Hellinger , definită de la distanța Bhattacharyya de .
0≤BVS≤1{\ displaystyle 0 \ leq BC \ leq 1}0≤DB≤∞{\ displaystyle 0 \ leq D_ {B} \ leq \ infty}1-BVS{\ displaystyle {\ sqrt {1-BC}}}
Pentru distribuții gaussiene multivariate ,
peu=NU(meu,Peu){\ displaystyle p_ {i} = N (m_ {i}, P_ {i})}
DB=18(m1-m2)TP-1(m1-m2)+12ln(detPdetP1detP2){\ displaystyle D_ {B} = {1 \ over 8} (m_ {1} -m_ {2}) ^ {T} P ^ {- 1} (m_ {1} -m_ {2}) + {1 \ over 2} \ ln \, \ left ({\ det P \ over {\ sqrt {\ det P_ {1} \, \ det P_ {2}}}} \ right)},
unde și sunt mijloacele și covarianțele distribuțiilor și .
meu{\ displaystyle m_ {i}}Peu{\ displaystyle P_ {i}}P=P1+P22{\ displaystyle P = {P_ {1} + P_ {2} \ peste 2}}
Această scriere arată că, în cazul Gaussian, primul termen al distanței Bhattacharyya este legat de distanța Mahalanobis .
Coeficientul Bhattacharyya
Note și referințe
-
(în) A. Bhattacharyya , „ Măsurăm divergența între două populații statistice definite de distribuțiile lor de probabilitate ” , Buletinul Societății Matematice din Calcutta (în) , vol. 35,1943, p. 99–109, MR 0010358
-
(în) Sergios Theodoridis și Konstantinos Koutroumbas, Recunoașterea modelelor , Amsterdam / Boston, Academic Press,2006( ISBN 978-0-12-369531-4 ), p. 228
Vezi și tu
Articole similare
Bibliografie
- (ro) F. Nielsen și S. Boltz , „ Centroizii Burbea-Rao și Bhattacharyya ” , ArXiv: 1004.5049v1 ,2010( citește online )
- (în) Thomas Kailath (în) , " Divergența și măsurile de distanță Bhattacharyya în selectarea semnalului " , IEEE Transactions on Communications Technology , vol. 15, n o 1,1967, p. 52-60 ( DOI 10.1109 / TCOM.1967.1089532 )
- (ro) A. Djouadi , O. Snorrason și F. Garber , „ Calitatea estimărilor de formare-eșantion ale coeficientului Bhattacharyya ” , IEEE Transactions on Pattern Analysis and Machine Intelligence , vol. 12, n o 1,1990, p. 92-97 ( DOI 10.1109 / 34.41388 )
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">