Graficul unui lanț Markov și clasificarea statelor
Graficul unui lanț Markov și clasificarea stărilor sunt noțiuni de teoria grafurilor utilizate în probabilitate calcul .
Graficul unui lanț Markov
Graficul unui lanț Markov este un grafic direcționat definit din spațiul de stare și matricea de tranzițieG{\ displaystyle G}
E{\ displaystyle E}
P=(peu,j)(eu,j)∈E2{\ displaystyle \ P = \ left (p_ {i, j} \ right) _ {(i, j) \ în E ^ {2}}}![{\ displaystyle \ P = \ left (p_ {i, j} \ right) _ {(i, j) \ în E ^ {2}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/354f82854119c7108a2c96654bcacc2f37a8ab94)
din acest lanț Markov :
- vârfurile sunt elementeleG{\ displaystyle G}
E,{\ displaystyle E,}
- marginile sunt verificarea cuplurilor G{\ displaystyle G}
(eu,j)∈E2{\ displaystyle (i, j) \ în E ^ {2}}![{\ displaystyle (i, j) \ în E ^ {2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/58fb3a38d3b2bbb271719082311e28539721dfa1)
peu,j>0.{\ displaystyle p_ {i, j}> 0.}![{\ displaystyle p_ {i, j}> 0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/70de59cabca6ff54201380b70449cfd46fb0b3f7)
Clasificarea statelor
Căci , spunem că este accesibil din cazul în care și numai dacă există astfel încât să denotăm:
(eu,j)∈E2{\ displaystyle (i, j) \ în E ^ {2}}
j{\ displaystyle j}
eu{\ displaystyle i}
nu≥0{\ displaystyle n \ geq 0}
P(Xnu=j∣X0=eu)>0.{\ displaystyle \ mathbb {P} (X_ {n} = j \ mid X_ {0} = i)> 0.}![{\ displaystyle \ mathbb {P} (X_ {n} = j \ mid X_ {0} = i)> 0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f541d94029124b066dbe8c7a50d099e27a863b11)
{j←eu}⇔{∃nu≥0 ca peu,j(nu)>0}.{\ displaystyle \ {j \ leftarrow i \} \ quad \ Leftrightarrow \ quad \ left \ {\ există n \ geq 0 {\ text {cum ar fi}} p_ {i, j} ^ {(n)}> 0 \ dreapta \}.}
Spunem asta și comunicăm dacă și numai dacă există astfel încât și denotăm:
eu{\ displaystyle i}
j{\ displaystyle j}
(nu,m)∈NU2{\ displaystyle (n, m) \ in \ mathbb {N} ^ {2}}
P(Xnu=j∣X0=eu)>0{\ displaystyle \ mathbb {P} (X_ {n} = j \ mid X_ {0} = i)> 0}
P(Xm=eu∣X0=j)>0.{\ displaystyle \ mathbb {P} (X_ {m} = i \ mid X_ {0} = j)> 0.}![{\ displaystyle \ mathbb {P} (X_ {m} = i \ mid X_ {0} = j)> 0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e48e2ce0c4fe6417eaeee4550616932535ab6f3c)
{j↔eu}⇔{j←eu și eu←j}.{\ displaystyle \ {j \ leftrightarrow i \} \ quad \ Leftrightarrow \ quad \ left \ {j \ leftarrow i {\ text {și}} i \ leftarrow j \ right \}.}
Relația de a comunica , notată este o relație de echivalență . Când vorbim de clasă atunci când vorbim despre stările unui lanț Markov, în general se referă la clasele de echivalență pentru relația . Dacă toate statele comunică, se spune că lanțul Markov este ireductibil .
↔,{\ displaystyle \ leftrightarrow,}
↔{\ displaystyle \ leftrightarrow}![\ leftrightarrow](https://wikimedia.org/api/rest_v1/media/math/render/svg/046b918c43e05caf6624fe9b676c69ec9cd6b892)
Relația de a fi accesibilă , notată, se extinde la clasele de echivalență: pentru două clase și , avem
←,{\ displaystyle \ leftarrow,}
VS{\ displaystyle C}
VS′{\ displaystyle C ^ {\ prime}}![{\ displaystyle C ^ {\ prime}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/edf8835a4a5ba87d28074a31366a49cac013762d)
{VS←VS′}⇔{∃(eu,j)∈VS×VS′,eu←j}⇔{∀(eu,j)∈VS×VS′,eu←j}.{\ displaystyle \ {C \ leftarrow C ^ {\ prime} \} \ quad \ Leftrightarrow \ quad \ left \ {\ există (i, j) \ în C \ times C ^ {\ prime}, \ qquad i \ leftarrow j \ right \} \ quad \ Leftrightarrow \ quad \ left \ {\ forall (i, j) \ in C \ times C ^ {\ prime}, \ qquad i \ leftarrow j \ right \}.}
Relația este o relație de ordine între clasele de echivalență.
←{\ displaystyle \ leftarrow}![\ sageata stanga](https://wikimedia.org/api/rest_v1/media/math/render/svg/3c0fb4bce772117bbaf55b7ca1539ceff9ae218c)
Se spune că o clasă este finală dacă nu conduce la alta, adică dacă clasa este minimă pentru relație. În caz contrar, clasa se spune că este tranzitorie .
←.{\ displaystyle \ leftarrow.}![{\ displaystyle \ leftarrow.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/db255e68a381f874ddfde7909da7bb43c89257c2)
Este
Meuj={nu≥0 | P(Xnu=j∣X0=eu)>0}.{\ displaystyle M_ {ij} = \ {n \ geq 0 \ | \ P (X_ {n} = j \ mid X_ {0} = i)> 0 \}.}![{\ displaystyle M_ {ij} = \ {n \ geq 0 \ | \ P (X_ {n} = j \ mid X_ {0} = i)> 0 \}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3fbffd882a2d34d41666d984918a8d8956af6ec5)
Perioada unui stat este GCD setului. În
cazul în care două state comunică, ele au aceeași perioadă: prin urmare , putem vorbi de perioada unei clase de stări. Dacă perioada este 1, se spune că clasa este aperiodică .
eu{\ displaystyle i}
Meueu.{\ displaystyle M_ {ii}.}![{\ displaystyle M_ {ii}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fe6172a719c136681e92b54d3e25fe8db6c6d9a8)
Clasificarea stărilor poate fi citită într-un mod simplu pe graficul lanțului Markov.
Mers aleatoriu pe un grup finit:
Luați în considerare un grup și o măsură de probabilitate pe acest grup, precum și o suită de variabile aleatoare independente de drept este reprezentat
(G,⊕){\ displaystyle (G, \ oplus)}
μ{\ displaystyle \ mu}
(Danu)nu≥1{\ displaystyle (Y_ {n}) _ {n \ geq 1}}
μ.{\ displaystyle \ mu.}![{\ displaystyle \ mu.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a1ef6db045c1f6193799bd25a4b68ba9f78646d2)
X0=X0∈Gși∀nu≥1, Xnu=Xnu-1⊕Danu.{\ displaystyle X_ {0} = x_ {0} \ in G \ quad {\ text {et}} \ quad \ forall \, n \ geq 1, \ X_ {n} = X_ {n-1} \ oplus Y_ {nu}.}![{\ displaystyle X_ {0} = x_ {0} \ in G \ quad {\ text {et}} \ quad \ forall \, n \ geq 1, \ X_ {n} = X_ {n-1} \ oplus Y_ {nu}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9da6578c9fc0011bd15023a539dafaab8a2b0b9c)
Deci, se numește mers aleatoriu, nu pe grup , procesul stocastic este un proces Markov . Este un lanț Markov dacă este finit sau numărabil (în acest caz ). Notă suportul de :
(Xnu)nu≥0{\ displaystyle (X_ {n}) _ {n \ geq 0}}
μ{\ displaystyle \ mu}
(G,⊕).{\ displaystyle (G, \ oplus).}
(Xnu)nu≥0{\ displaystyle (X_ {n}) _ {n \ geq 0}}
G{\ displaystyle G}
μ=(μg)g∈G{\ displaystyle \ mu = (\ mu _ {g}) _ {g \ în G}}
supp(μ){\ displaystyle {\ text {supp}} (\ mu)}
μ{\ displaystyle \ mu}![\ mu](https://wikimedia.org/api/rest_v1/media/math/render/svg/9fd47b2a39f7a7856952afec1f1db72c67af6161)
supp(μ)={g∈G|μg>0},{\ displaystyle {\ text {supp}} (\ mu) = \ {g \ în G \ quad | \ quad \ mu _ {g}> 0 \},}![{\ displaystyle {\ text {supp}} (\ mu) = \ {g \ în G \ quad | \ quad \ mu _ {g}> 0 \},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e180c403764ccbe08465425e5a8687537b5ea501)
și denotați subgrupul generat de Apoi, clasele din modulul drept (de tip ) sunt, de asemenea, clasele pentru relație. Aceste clase sunt toate finale.
H{\ displaystyle H}
supp(μ).{\ displaystyle {\ text {supp}} (\ mu).}
H,{\ displaystyle H,}
XH={Xh | h∈H}{\ displaystyle xH = \ {xh \ | \ h \ în H \}}
↔.{\ displaystyle \ leftrightarrow.}![{\ displaystyle \ leftrightarrow.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5c5995139d7c936bf611dc94123ea31b166e3afe)
Pași pe cub:
- Mersul aleatoriu pe marginile cubului poate fi văzut ca mersul pe grupul de pași, de fapt adăugarea unuia dintre cei 3 vectori ai bazei canonice echivalează cu schimbarea uneia dintre cele trei coordonate ale punctului de plecare, adică acest lucru înseamnă împrumuturi , la întâmplare, una dintre cele 3 margini de la punctul de plecare. În acest caz și mersul pe jos este ireductibil.(Z23,+),{\ displaystyle (\ mathbb {Z} _ {2} ^ {3}, +),}
μ0=13(δ(1,0,0)+δ(0,1,0)+δ(0,0,1)):{\ displaystyle \ mu _ {0} = {\ tfrac {1} {3}} (\ delta _ {(1,0,0)} + \ delta _ {(0,1,0)} + \ delta _ {(0,0,1)}):}
H0=⟨supp(μ0)⟩=G,{\ displaystyle H_ {0} = \ langle {\ text {supp}} (\ mu _ {0}) \ rangle = G,}![{\ displaystyle H_ {0} = \ langle {\ text {supp}} (\ mu _ {0}) \ rangle = G,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ba69746d4a0f3efdffb53098d78a30e62047ce1a)
- Dacă pasul este și pasul are două clase finale: cele 2 fețe orizontale.μ1=12(δ(1,0,0)+δ(0,1,0)),{\ displaystyle \ mu _ {1} = {\ tfrac {1} {2}} (\ delta _ {(1,0,0)} + \ delta _ {(0,1,0)}),}
H1=⟨supp(μ1)⟩=Z22×{0},{\ displaystyle H_ {1} = \ langle {\ text {supp}} (\ mu _ {1}) \ rangle = \ mathbb {Z} _ {2} ^ {2} \ times \ {0 \},}![{\ displaystyle H_ {1} = \ langle {\ text {supp}} (\ mu _ {1}) \ rangle = \ mathbb {Z} _ {2} ^ {2} \ times \ {0 \},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8196681a7cec22e60d2d55e885fec955e342a0cd)
- Dacă pasul este și mersul are 4 clase finale: cele 4 margini verticale.μ2=δ(0,0,1),{\ displaystyle \ mu _ {2} = \ delta _ {(0,0,1)},}
H2={0}2×Z2,{\ displaystyle H_ {2} = \ {0 \} ^ {2} \ times \ mathbb {Z} _ {2},}![{\ displaystyle H_ {2} = \ {0 \} ^ {2} \ times \ mathbb {Z} _ {2},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2b3ac65fc5b533582a3e3f96d00c00d027d20aad)
- Dacă pasul este și mersul are două clase finale: cele 2 tetraedre inscripționate.μ3=12(δ(0,1,1)+δ(1,0,1)),{\ displaystyle \ mu _ {3} = {\ tfrac {1} {2}} (\ delta _ {(0,1,1)} + \ delta _ {(1,0,1)}),}
|H3|=4,{\ displaystyle | H_ {3} | = 4,}![{\ displaystyle | H_ {3} | = 4,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ea61912c10375c231f9186e473ac2857c67b777f)
Pași aleatori pe octogon:
- 1 st Markov lanțul figurii împotriva unor practici un mers aleator pe gruparea ciclică de nici în acest exemplu,Z8,{\ displaystyle \ mathbb {Z} _ {8},}
μ=pδ1+qδ-1.{\ displaystyle \ mu = p \ delta _ {1} + q \ delta _ {- 1}.}
H=⟨supp(μ)⟩=Z8.{\ displaystyle H = \ langle {\ text {supp}} (\ mu) \ rangle = \ mathbb {Z} _ {8}.}
- 2 e Markov lanțul figurii împotriva este o plimbare aleatorie pe grupul diedru de pași , care este pătrat de simetrie (ABCD) în raport cu diagonala (a, c), care este simetria relativ pătrat la axa orizontală , celelalte două simetrii fiind și ; este rotația unghiului În acest exemplu,D4,{\ displaystyle D_ {4},}
ν=pδτ+qδρ,{\ displaystyle \ nu = p \ delta _ {\ tau} + q \ delta _ {\ rho},}
τ=(b,d){\ displaystyle \ tau = (b, d)}
ρ=(la,b)(vs.,d){\ displaystyle \ rho = (a, b) (c, d)}
τ∘ρ∘τ{\ displaystyle \ tau \ circ \ rho \ circ \ tau}
ρ∘τ∘ρ{\ displaystyle \ rho \ circ \ tau \ circ \ rho}
σ=ρ∘τ=(la,b,vs.,d){\ displaystyle \ sigma = \ rho \ circ \ tau = (a, b, c, d)}
π/2.{\ displaystyle \ pi / 2.}
H=⟨supp(ν)⟩=D4.{\ displaystyle H = \ langle {\ text {supp}} (\ nu) \ rangle = D_ {4}.}
Cele două lanțuri sunt deci recurente ireductibile și pozitive, de drept staționar uniform.
Lexicon: grafice în lanț Markov
- Raportul este accesibil din raport dacă și numai dacă este îndeplinită una dintre următoarele două condiții:
j{\ displaystyle j}
eu{\ displaystyle i}![eu](https://wikimedia.org/api/rest_v1/media/math/render/svg/add78d8608ad86e54951b8c8bd6c8d8416533d20)
- există o cale care merge de sus în sus în graficeu{\ displaystyle i}
j{\ displaystyle j}
G,{\ displaystyle G,}
- eu=j.{\ displaystyle i = j.}
![{\ displaystyle i = j.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8a34cbf822352a27e65419b20aaffd43731848b2)
- Un lanț Markov este ireductibil dacă și numai dacă graficul său este puternic conectat , adică dacă pentru orice pereche de vârfuri ale graficului există o cale de la și o cale de laeu≠j{\ displaystyle i \ neq j}
eu{\ displaystyle i}
j{\ displaystyle j}
j{\ displaystyle j}
eu.{\ displaystyle i.}
- O clasă a unui lanț Markov este o componentă puternic conectată a graficului său. În prima figură din partea de sus a paginii (cu stările 1, 2, 3, 4, 5), graficul neorientat indus de graficul lanțului Markov are 2 componente conectate , dar graficul lanțului Markov (care este un grafic direcționat) are 3 componente puternic conectate , deoarece 2 nu comunică nici cu 1, nici cu 3.
Graficul unui lanț Markov și proprietăți probabilistice
Anumite proprietăți probabiliste ale stărilor unui lanț Markov sunt împărtășite de toate stările din aceeași clasă. Mai precis:
- dacă o clasă nu este finală, toate stările sale sunt tranzitorii (sau tranzitorii),VS{\ displaystyle C}
![VS](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fc55753007cd3c18576f7933f6f089196732029)
- dacă o clasă este atât finală, cât și finită, toate stările sale sunt recurente pozitive .VS{\ displaystyle C}
![VS](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fc55753007cd3c18576f7933f6f089196732029)
Stările unei clase finale pot fi foarte tranzitorii (de exemplu, în cazul mersului simplu părtinitor sau altele toate zero recurente (de exemplu, în cazul mersului simplu simetric pe cel mult este necesar ca clasa finală în cauză este infinită Există, de asemenea, exemple de clasă finală infinită recurentă pozitivă.
Z),{\ displaystyle \ mathbb {Z}),}
Z).{\ displaystyle \ mathbb {Z}).}![{\ displaystyle \ mathbb {Z}).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/595d4d53f0164c6dab3ecf642a448ccd1387de73)
In caz contrar,
- dacă există recurent în clasă , atunci orice stare de este recurentă,eu{\ displaystyle i}
VS{\ displaystyle C}
j{\ displaystyle j}
VS{\ displaystyle C}![VS](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fc55753007cd3c18576f7933f6f089196732029)
- dacă există o recurență pozitivă în clasă , atunci orice stare de este recurentă pozitivă,eu{\ displaystyle i}
VS{\ displaystyle C}
j{\ displaystyle j}
VS{\ displaystyle C}![VS](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fc55753007cd3c18576f7933f6f089196732029)
- dacă există o recurență nulă în clasă , atunci orice stare de este recurentă nulă,eu{\ displaystyle i}
VS{\ displaystyle C}
j{\ displaystyle j}
VS{\ displaystyle C}![VS](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fc55753007cd3c18576f7933f6f089196732029)
- dacă există clasă tranzitorie în clasă , atunci orice stare a este tranzitorie,eu{\ displaystyle i}
VS{\ displaystyle C}
j{\ displaystyle j}
VS{\ displaystyle C}![VS](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fc55753007cd3c18576f7933f6f089196732029)
- dacă există perioadă în clasă , atunci orice stare de este perioadăeu{\ displaystyle i}
d{\ displaystyle d}
VS{\ displaystyle C}
j{\ displaystyle j}
VS{\ displaystyle C}
d,{\ displaystyle d,}
- dacă există aperiodic în clasă , atunci orice stare de este aperiodic.eu{\ displaystyle i}
VS{\ displaystyle C}
j{\ displaystyle j}
VS{\ displaystyle C}![VS](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fc55753007cd3c18576f7933f6f089196732029)
Prin urmare, spunem că clasa este tranzitorie, recurentă, aperiodică etc. deoarece acestea sunt de fapt proprietăți ale clasei, precum și proprietăți ale unei anumite stări.
VS{\ displaystyle C}![VS](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fc55753007cd3c18576f7933f6f089196732029)
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">