Legea lui Wishart
În teoria probabilității și statisticile , legea lui Wishart este generalizarea multidimensională a legii χ² sau, în cazul în care numărul de grade de libertate nu este întreg, a legii gamma . Legea este numită în onoarea lui John Wishart, care a formulat-o prima dată în 1928.
Este o familie de legi de probabilitate pe matrici definite pozitive , simetrice. O variabilă aleatorie cu legea lui Wishart este deci o matrice aleatorie . Trei legi sunt de mare importanță în estimarea matricelor varianță-covarianță .
Dacă o variabilă aleatorie X urmează o lege Wishart, vom indica sauX∼Wp(V,nu){\ displaystyle X \ sim W_ {p} (V, n)}W(V,p,nu){\ displaystyle W (V, p, n)}
Definiție
Să presupunem că Y este o matrice n × p , rândurile sunt vectori aleatori independenți și urmează o distribuție normală p-dimensională centrată:
Da(eu)=(yeu1,...,yeup)∼NUp(0,V).{\ displaystyle Y _ {(i)} {=} (y_ {i} ^ {1}, \ dots, y_ {i} ^ {p}) \ sim {\ mathcal {N}} _ {p} (0 , V).}Apoi , legea lui Wishart este legea de probabilitate de p × p matrice
X=DaTDa{\ displaystyle X = Y ^ {T} Y \, \!}cunoscută sub numele de matrice de dispersie . Numărul natural n este numărul de grade de libertate . Pentru n > p , matricea X este inversabilă cu probabilitatea 1 dacă V este inversabilă. Dacă p = 1 și V = 1 , atunci legea lui Wishart este legea χ² cu n grade de libertate.
utilizare
Legea lui Wishart apare ca legea unei matrici de covarianță a unui eșantion de valori conform unei legi normale multidimensionale . Apare frecvent în testele de maximă probabilitate în analiza statistică multivariată. Apare, de asemenea, în teoria spectrală a matricelor aleatorii și în analiza Bayesiană multidimensională .
Probabilitate densitate
Legea lui Wishart poate fi caracterizată prin densitatea sa de probabilitate după cum urmează. Fixăm V o matrice simetrică pozitivă definită p × p (parametru de scară). Dacă n ≥ p , atunci densitatea de probabilitate a legii lui Wishart este dată de:
f(X)=12nup2|V|nu2Γp(nu2)|X|nu-p-12e-12tr(V-1X){\ displaystyle f (\ mathbf {X}) = {\ frac {1} {2 ^ {\ frac {np} {2}} \ left | {\ mathbf {V}} \ right | ^ {\ frac {n } {2}} \ Gamma _ {p} ({\ frac {n} {2}})}} {\ left | \ mathbf {X} \ right |} ^ {\ frac {np-1} {2} } e ^ {- {\ frac {1} {2}} {\ rm {tr}} ({\ mathbf {V}} ^ {- 1} \ mathbf {X})}}pentru orice matrice pxp X simetrică pozitivă definită și unde Γ p este funcția gamma multidimensională definită de:
Γp(nu/2)=πp(p-1)4∏j=1pΓ[nu-j+12].{\ displaystyle \ Gamma _ {p} (n / 2) = \ pi ^ {\ frac {p (p-1)} {4}} \ prod _ {j = 1} ^ {p} \ Gamma \ left [ {\ frac {nj + 1} {2}} \ right].}De fapt, definiția anterioară poate fi extinsă la orice n ≥ p real . Dacă n < p , atunci legea lui Wishart nu mai are densitate, ci devine o lege singulară.
Proprietăți
General
O matrice aleatorie trasată conform construcției definiției de mai sus este întotdeauna o matrice simetrică definită pozitivă . Aceasta înseamnă că toate valorile sale proprii sunt strict pozitive.
X{\ displaystyle X}
Jurnal-așteptare
Așteptarea logaritmului este dată de:
E[ln|X|]=∑eu=1pψ(nu+1-eu2)+pln2+ln|V|{\ displaystyle \ operatorname {E} [\ ln | \ mathbf {X} |] = \ sum _ {i = 1} ^ {p} \ psi \ left ({\ frac {n + 1-i} {2} } \ right) + p \ ln 2+ \ ln | \ mathbf {V} |}unde ψ este funcția digamma , adică derivata logaritmică a funcției gamma .
Calculul său este dezvoltat aici .
Entropie
Entropia legii Wishart este dată de următoarea formulă:
H[X]=-lnB(V,nu)-(nu-p-1)2E[ln|X|]+nup2{\ displaystyle \ operatorname {H} [\ mathbf {X}] = - \ ln B (\ mathbf {V}, n) - {\ frac {(np-1)} {2}} \ operatorname {E} [ \ ln | \ mathbf {X} |] + {\ frac {np} {2}}}unde este constanta de renormalizare a legii:
B(V,nu){\ displaystyle B (\ mathbf {V}, n)}
B(V,nu)=1|V|nu22nup2Γp(nu2){\ displaystyle B (\ mathbf {V}, n) = {\ frac {1} {\ left | \ mathbf {V} \ right | ^ {\ frac {n} {2}} 2 ^ {\ frac {np } {2}} \ Gamma _ {p} ({\ frac {n} {2}})}}}Entropia poate fi scrisă ca:
H[X]=nu2ln|V|+nup2ln2+lnΓp(nu2)-(nu-p-1)2E[ln|X|]+nup2=nu2ln|V|+nup2ln2+p(p-1)4lnπ+∑eu=1plnΓ[nu/2+(1-j)/2]-(nu-p-1)2(∑eu=1pψ(nu+1-eu2)+pln2+ln|V|)+nup2=nu2ln|V|-(nu-p-1)2ln|V|+nup2ln2-(nu-p-1)2pln2+p(p-1)4lnπ+∑eu=1plnΓ[nu/2+(1-j)/2]-(nu-p-1)2∑eu=1pψ(nu+1-eu2)+nup2=p+12ln|V|+p(p+1)2ln2+p(p-1)4lnπ+∑eu=1plnΓ[nu/2+(1-j)/2]-(nu-p-1)2∑eu=1pψ(nu+1-eu2)+nup2.{\ displaystyle {\ begin {align} \ operatorname {H} [\ mathbf {X}] & = {\ frac {n} {2}} \ ln | \ mathbf {V} | + {\ frac {np} { 2}} \ ln 2+ \ ln \ Gamma _ {p} ({\ frac {n} {2}}) - {\ frac {(np-1)} {2}} \ operatorname {E} [\ ln | \ mathbf {X} |] + {\ frac {np} {2}} \\ & = {\ frac {n} {2}} \ ln | \ mathbf {V} | + {\ frac {np} { 2}} \ ln 2 + {\ frac {p (p-1)} {4}} \ ln \ pi + \ sum _ {i = 1} ^ {p} \ ln \ Gamma \ left [n / 2 + (1-j) / 2 \ right] \\ & \ quad - {\ frac {(np-1)} {2}} \ left (\ sum _ {i = 1} ^ {p} \ psi \ left ( {\ frac {n + 1-i} {2}} \ right) + p \ ln 2+ \ ln | \ mathbf {V} | \ right) + {\ frac {np} {2}} \\ & = {\ frac {n} {2}} \ ln | \ mathbf {V} | - {\ frac {(np-1)} {2}} \ ln | \ mathbf {V} | + {\ frac {np} {2}} \ ln 2 - {\ frac {(np-1)} {2}} p \ ln 2 + {\ frac {p (p-1)} {4}} \ ln \ pi \\ & \ quad + \ sum _ {i = 1} ^ {p} \ ln \ Gamma \ left [n / 2 + (1-j) / 2 \ right] - {\ frac {(np-1)} {2}} \ sum _ {i = 1} ^ {p} \ psi \ left ({\ frac {n + 1-i} {2}} \ right) + {\ frac {np} {2}} \\ & = { \ frac {p + 1} {2}} \ ln | \ mathbf {V} | + {\ frac {p (p + 1)} {2}} \ ln 2 + {\ frac {p (p-1) } {4}} \ ln \ pi \\ & \ quad + \ sum _ {i = 1} ^ {p} \ ln \ Gamma \ left [n / 2 + (1-j) / 2 \ right] - { \ frac {(np-1)} {2}} \ sum _ {i = 1} ^ {p} \ psi \ left ({\ frac {n + 1- i} {2}} \ right) + {\ frac {np} {2}}. \\\ end {align}}}
Funcția caracteristică
Funcția caracteristică a legii lui Wishart este dată de :
Θ↦|Eu-2euΘV|-nu/2.{\ displaystyle \ Theta \ mapsto \ left | {\ mathbf {I}} -2i \, {\ mathbf {\ Theta}} {\ mathbf {V}} \ right | ^ {- n / 2}.}
Cu alte cuvinte,
Θ↦E{eXp[eu⋅tr(XΘ)]}=|Eu-2euΘV|-nu/2{\ displaystyle \ Theta \ mapsto \ operatorname {E} \ left \ {\ mathrm {exp} \ left [i \ cdot \ mathrm {tr} (\ mathbf {X} {\ mathbf {\ Theta}}) \ right] \ right \} = \ left | {\ mathbf {I}} -2i {\ mathbf {\ Theta}} {\ mathbf {V}} \ right | ^ {- n / 2}}unde Θ și I sunt matrici de aceeași dimensiune ca V și I este matricea unitară .
Teorema
Dacă X urmează legea lui Wishart cu m grade de libertate și matricea de covarianță V și dacă C este o matrice q × p de rang q , atunci :
VSXVST∼Wq(VSVVST,m).{\ displaystyle {\ mathbf {C}} \ mathbf {X} {\ mathbf {C}} ^ {T} \ sim {\ mathcal {W}} _ {q} \ left ({\ mathbf {C}} { \ mathbf {V}} {\ mathbf {C}} ^ {T}, m \ right).}Corolarul 1
Dacă z este un vector p diferit de zero, atunci
zTXz∼σz2χm2.{\ displaystyle {\ mathbf {z}} ^ {T} \ mathbf {X} {\ mathbf {z}} \ sim \ sigma _ {z} ^ {2} \ chi _ {m} ^ {2}.}unde χ m 2 este legea loi² cu m grade de libertate și este o constantă pozitivă.
σz2=zTVz{\ displaystyle \ sigma _ {z} ^ {2} = {\ mathbf {z}} ^ {T} {\ mathbf {V}} {\ mathbf {z}}}
Corolarul 2
Luați în considerare cazul în care (adică j -th element este 1 și celelalte 0). Apoi Corolarul 1 arată că:
zT=(0,...,0,1,0,...,0){\ displaystyle {\ mathbf {z}} ^ {T} = (0, \ ldots, 0,1,0, \ ldots, 0)}
wjj∼σjjχm2{\ displaystyle w_ {dd} \ sim \ sigma _ {dd} \ chi _ {m} ^ {2}}dă legea marginală a fiecăruia dintre elementele diagonalei matricei.
Trebuie remarcat faptul că distribuția Wishart nu este numită legea lui χ 2 multidimensională, deoarece marginale în afara diagonalei nu sunt legile lui χ 2 .
Descompunerea Bartlett
Descompunerea Bartlett a unei matrice X , conform unui p -dimensional legea Wishart de scară V matrice și cu n grade de libertate este factorizarea :
X=LLALATLT{\ displaystyle \ mathbf {X} = {\ textbf {L}} {\ textbf {A}} {\ textbf {A}} ^ {T} {\ textbf {L}} ^ {T}}unde L este factorizarea Cholesky a lui V și:
LA=(vs.100⋯0nu21vs.20⋯0nu31nu32vs.3⋯0⋮⋮⋮⋱⋮nup1nup2nup3⋯vs.p){\ displaystyle \ mathbf {A} = {\ begin {pmatrix} {\ sqrt {c_ {1}}} și 0 & 0 & \ cdots & 0 \\ n_ {21} & {\ sqrt {c_ {2}} } & 0 & \ cdots & 0 \\ n_ {31} & n_ {32} & {\ sqrt {c_ {3}}} & \ cdots & 0 \\\ vdots & \ vdots & \ vdots & \ ddots & \ vdots \\ n_ {p1} & n_ {p2} & n_ {p3} & \ cdots & {\ sqrt {c_ {p}}} \ end {pmatrix}}}unde și sunt independenți. Aceasta oferă o metodă utilă pentru obținerea eșantioanelor valorilor legii lui Wishart.
vs.eu∼χnu-eu+12{\ displaystyle c_ {i} \ sim \ chi _ {n-i + 1} ^ {2}}nueuj∼NU(0,1){\ displaystyle n_ {ij} \ sim {\ mathcal {N}} (0,1) \,}
Proprietatea de concentrare
Notând măsura probabilității în raport cu matricea de ordine aleatorie (aceasta corespunde definiției de mai sus pentru matricea de identitate a ordinii ), precum și notând (resp. ) Cea mai mare (resp. Cea mai mică) dintre valorile proprii a unei matrice simetrice definite pozitive, atunci putem afirma următoarea proprietate: valorile proprii ale matricei aleatorii verificăP{\ displaystyle \ mathbb {P}}X{\ displaystyle X}nu×p{\ displaystyle n \ times p}V=Eup{\ displaystyle V = I_ {p}}p{\ displaystyle p}λmlaX(LA){\ displaystyle \ lambda _ {max} (A)}λmeunu(LA){\ displaystyle \ lambda _ {min} (A)}LA{\ displaystyle A}X=DaTDa{\ displaystyle X {=} Y ^ {T} Y}
pe de o parte , ,
∀X>0{\ displaystyle \ forall x> 0}P(λmlaX(X)≥nu(1+p/nu+2X/nu)2)≤e-X{\ displaystyle \ mathbb {P} \ left (\ lambda _ {max} (X) \ geq n \ left (1 + {\ sqrt {p / n}} + {\ sqrt {2x / n}} \ right) ^ {2} \ right) \ leq e ^ {- x}}
și pe de altă parte ,∀X>0{\ displaystyle \ forall x> 0}P(λmeunu(X)≤nu(1-p/nu-2X/nu)2)≤e-X{\ displaystyle \ mathbb {P} \ left (\ lambda _ {min} (X) \ leq n \ left (1 - {\ sqrt {p / n}} - {\ sqrt {2x / n}} \ right) ^ {2} \ right) \ leq e ^ {- x}}
Aceasta înseamnă că cu o probabilitate cel puțin egală cu valorile proprii ale unei astfel de matrice sunt între și .
1-2e-X{\ displaystyle 1-2e ^ {- x}}nu(1-d/nu-2X/nu)2{\ displaystyle n \ left (1 - {\ sqrt {d / n}} - {\ sqrt {2x / n}} \ right) ^ {2}}nu(1+d/nu+2X/nu)2{\ displaystyle n \ left (1 + {\ sqrt {d / n}} + {\ sqrt {2x / n}} \ right) ^ {2}}
Relația cu alte legi
- Legea lui Wishart este legată de legea inversă a lui Wishart , notată W p −1 , după cum urmează: dacă și dacă efectuăm schimbarea variabilelor , atunci . Această relație poate fi obținută observând că valoarea absolută iacobiană a acestei modificări de variabilă este , a se vedea de exemplu ecuația (15.15) în [Dwyer].X∼Wp(V,nu){\ displaystyle \ mathbf {X} \ sim W_ {p} (\ mathbf {V}, n)}VS=X-1{\ displaystyle \ mathbf {C} = \ mathbf {X} ^ {- 1}}VS∼Wp-1(V-1,nu){\ displaystyle \ mathbf {C} \ sim W_ {p} ^ {- 1} (\ mathbf {V} ^ {- 1}, n)}|VS|p+1{\ displaystyle | \ mathbf {C} | ^ {p + 1}}
- Legea lui Wishart este un caz special al legii gamma multidimensionale .
Referințe
-
(în) J. Wishart , „ Distribuția produsului în timp generalizat în eșantioane din populația multivariată normală are ” , Biometrika , vol. 20A, n os 1-2,1928, p. 32-52 ( DOI 10.1093 / biomet / 20A.1-2.32 )
-
„Despre distribuțiile beta singulare Wishart și singulare multivariate” de Harald Uhlig, Annals of Statistics , 1994, 395-405
proiectuclid
-
C.M. Bishop, Recunoașterea modelelor și învățarea automată , Springer 2006, p. 693.
-
(în) WB Smith și RR Hocking , " Algorithm AS 53: Wishart Variate Generator " , Journal of the Royal Statistical Society. Seria C (Statistici aplicate) , vol. 21, n o 3,1972, p. 341-345 ( JSTOR 2346290 )
-
(în) Verzelen și Gassiat, " Estimarea adaptivă a raportului semnal înalt la zgomot " , arXiv ,16 martie 2017, p. 41 ( citește online )
-
Paul S. Dwyer, „UNELE APLICAȚII A DERIVATELOR MATRICEI ÎN ANALIZA MULTIVARIATĂ”, JASA 1967; 62: 607-625, disponibil JSTOR .
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">