Netezire exponențială

Netezirea exponențială este o metodă empirică de netezire și prognoză a datelor seriilor de timp afectate de pericole. Ca și în metoda mediilor mobile , fiecare dată este netezită succesiv începând de la valoarea inițială. Dar, în timp ce media mobilă dă aceeași greutate tuturor observațiilor transmise într-o anumită fereastră, netezirea exponențială conferă observațiilor din trecut o greutate care scade exponențial odată cu vârsta lor. Netezirea exponențială este una dintre metodele de fereastră utilizate în procesarea semnalului. Acționează ca un filtru de trecere jos prin eliminarea frecvențelor înalte de la semnalul inițial.

Se notează seria de date brute , începând cu . Se remarcă rezultatul netezirii exponențiale ; acest lucru poate fi văzut ca o estimare a , eliberată de pericole (în procesarea semnalului, zicem zgomot ), în funcție de trecut. Rezultatul depinde însă de practica utilizatorului (alegerea factorului de netezire). ${\ displaystyle \ {y_ {t} \}}$ $t = 0$ ${\ displaystyle \ {s_ {t} \}}$ ${\ displaystyle {\ hat {y}} _ {t}}$ $YT}$

Netezirea exponențială este cu adevărat utilă doar pentru datele care sunt aproximativ staționare (adică nu sunt afectate de creșteri sau scăderi puternice sau de variații sezoniere). Când există o tendință, metoda trebuie să fie complicată ( netezire exponențială dublă ). Nu oferă nicio asistență pentru prelucrarea datelor sezoniere. De natură empirică, metoda nu oferă nicio indicație a proprietăților statistice ale rezultatelor.

Pentru o serie începând cu , rezultatul netezirii exponențiale simple este dat de următoarele formule: $t = 0$

{\ displaystyle s_ {0} = y_ {0}}

pentru :

{\ displaystyle t> 0}

{\ displaystyle s_ {t} = \ alpha y_ {t} + (1- \ alpha) s_ {t-1}}

unde este factorul de netezire , cu

\alfa

0 <\ alfa <1

Netezire exponențială simplă

Windowing exponențială sau netezirea exponențială simplă este atribuită peștilor care ar fi metodele utilizate pe scară largă de la XVII - lea secol; această metodă a fost adoptată de specialiștii în procesarea semnalului în anii 1940.

Cea mai de bază expresie a netezirii exponențiale simple este dată de expresia:

{\ displaystyle s_ {t} = \ alpha \ cdot y_ {t} + (1- \ alpha) \ cdot s_ {t-1}}

Metoda este aplicabilă atunci când sunt disponibile două sau mai multe valori brute.

Parametrul α este un factor de netezire între 0 și 1. Cu alte cuvinte, s t poate fi văzut ca o medie ponderată între valoarea curentă y t și valoarea netedă anterioară s t - 1 . Numele „factor de netezire” dat lui α este înșelător în măsura în care netezirea scade atunci când α crește și că, în cazul limitativ în care α = 1, seria netezită este identică cu seria brută.

Valorile lui α apropiate de 1 reduc incidența trecutului și acordă o pondere mai mare valorilor recente; dimpotrivă, valorile apropiate de 0 măresc fluiditatea și reduc impactul valorilor recente. Nu există o metodă generală pentru determinarea „valorii corecte” a lui α. Acest lucru rezultă din experiența analistului. Putem, în unele cazuri, să alegem valoarea lui α care minimizează cantitatea ( s t - y t ) 2 (minimizarea pătratelor erorii de prognoză).

Spre deosebire de alte metode, netezirea exponențială nu necesită un număr minim de date pentru a fi aplicate (metoda funcționează din a doua dată disponibilă). Cu toate acestea, o netezire „bună” va fi obținută numai după ce o anumită cantitate de date a fost netezită; de exemplu, va fi nevoie de aproximativ 3 / α date zgomotoase ale unui semnal constant pentru ca acesta să fie abordat la 95%. Spre deosebire de media mobilă, netezirea exponențială nu acceptă datele lipsă.

Din punct de vedere tehnic, netezirea exponențială este un proces ARIMA (en) al clasei (0, 1, 1) fără o constantă.

Timpul constant

Constanta de timp a unei neteziri exponențiale este timpul necesar pentru ca răspunsul netezit al unui semnal constant să ajungă la 1 - 1 / e ≃ 63% din semnal. Această constantă de timp τ este legată de factorul de netezire α prin relația:

{\ displaystyle \ alpha = 1- \ mathrm {e} ^ {\ frac {- \ Delta \ mathrm {T}} {\ tau}}}

unde ΔT este durata intervalului discret de eșantionare a datelor. Dacă această durată este mică în comparație cu constanta de timp, această expresie este simplificată pentru:

{\ displaystyle \ alpha \ simeq {\ frac {\ Delta \ mathrm {T}} {\ tau}}}

Alegerea valorii inițiale

Netezirea exponențială începe prin presupunerea că s 0 = x 0 . Prin urmare, se presupune că prima valoare netezită este egală cu prima valoare brută observată. Dacă α este mic, valorile netezite depind puternic de trecut; prin urmare, valoarea inițială s 0 poate influența puternic următoarele valori. Alegerea valorii inițiale a procesului de netezire este, prin urmare, importantă. De exemplu, se poate păstra ca valoare inițială a netezirii media celor zece valori precedente (sau mai mult sau mai puțin în funcție de natura datelor brute). Cu cât este mai mic, cu atât rezultatele obținute depind de valorile inițiale. $\alfa$

Optimizare

Rezultatele netezirii exponențiale depind de alegerea parametrilor de netezire α. Netezirea exponențială este o metodă empirică și alegerea acestui parametru depinde adesea de experiența și cunoștințele analistului. Cu toate acestea, considerații mai obiective legate de date pot fi utilizate pentru a determina „cel mai bun α”:

Fiecare nouă valoare netedă s t este o „prognoză” a y t .

{\ displaystyle {\ hat {y}} _ {t}}

Obținem cea mai bună prognoză (în sensul celor mai mici pătrate ) găsind a cărei valoare minimizează suma pătratelor abaterilor (SCE): $\alfa$

{\ displaystyle \ mathrm {SCE} = \ sum _ {t = 1} ^ {\ mathrm {T}} (y_ {t} - {\ hat {y}} _ {t | t-1}) ^ {2 } = \ sum _ {t = 1} ^ {\ mathrm {T}} e_ {t} ^ {2}}

Cu toate acestea, spre deosebire de regresia liniară în care parametrii care minimizează SCE sunt obținuți prin rezolvarea ecuațiilor liniare, ecuațiile care trebuie rezolvate aici nu sunt liniare: trebuie deci să estimăm α cu un algoritm de minimizare.

De ce această netezire este „exponențială”?

Termenul "exponențial" descrie ponderile care sunt atribuite valorilor trecute în evaluarea valorii actuale: ca

{\ displaystyle s_ {t} = \ alpha y_ {t} + (1- \ alpha) s_ {t-1}}

obținem, înlocuind s t - 1 cu valoarea sa:

{\ displaystyle s_ {t} = \ alpha y_ {t} + \ alpha (1- \ alpha) y_ {t-1} + (1- \ alpha) ^ {2} s_ {t-2}}

și continuarea substituțiilor:

{\ displaystyle s_ {t} = \ alpha \ left [y_ {t} + (1- \ alpha) y_ {t-1} + (1- \ alpha) ^ {2} y_ {t-2} + (1 - \ alpha) ^ {3} y_ {t-3} + \ cdots + (1- \ alpha) ^ {t-1} y_ {1} \ right] + (1- \ alpha) ^ {t} y_ { 0}}

Ponderea datelor în evaluarea valorii actuale scade geometric datorită vârstei lor în raport cu valoarea curentă, adică în funcție de o funcție exponențial descrescătoare.

Comparație cu media mobilă

La fel ca netezirea medie mobilă, netezirea exponențială introduce o întârziere în rezultate, care depinde de perioada de eșantionare a datelor. La netezirea medie mobilă, puteți compensa acest efect prin deplasarea valorilor netezite cu o valoare egală cu jumătate din lățimea ferestrei de netezire (pentru o fereastră de netezire simetrică). Acest lucru nu este posibil cu netezirea exponențială. Din punct de vedere al calculului, o medie mobilă necesită păstrarea în memorie doar a ultimelor k valori (pentru o fereastră cu lățime k ) în timp ce netezirea exponențială necesită păstrarea tuturor valorilor anterioare.

Netezire exponențială dublă

Netezirea exponențială simplă nu funcționează bine atunci când datele brute sunt în tendințe sau în tendințe. Valorile netezite arată o subestimare sau supraestimare sistematică în funcție de direcția tendinței. Scopul metodelor de netezire dublă exponențială este de a netezi nivelul datelor (adică a elimina variațiile aleatorii) și de a netezi tendința, adică de a elimina efectul tendinței asupra valorilor netezite.

Există două metode de netezire dublă exponențială, metodă Holt (in) wide de Winters și metodă Brown (en)

Metoda Holt-Winters

Datele încep la momentul t = 0; din nou { y t } este seria brută de date. Avem cel puțin datele y 0 și y 1 . Termenul s t este seria de valori netezite și {σ t } estimările tendinței.

{\ displaystyle s_ {1} = y_ {1}}

{\ displaystyle \ sigma _ {1} = y_ {1} -y_ {0}}

pentru t > 1:

{\ displaystyle s_ {t} = \ alpha y_ {t} + (1- \ alpha) (s_ {t-1} + \ sigma _ {t-1})}

{\ displaystyle \ sigma _ {t} = \ beta (s_ {t} -s_ {t-1}) + (1- \ beta) \ sigma _ {t-1}}

Alegerea valorii inițiale y 0 este o chestiune de practică; se poate lua ca punct de plecare o medie a unui anumit număr de valori anterioare anterioare.

Din perioada t , o prognoză pentru perioada t + m este dată de:

{\ displaystyle \ mathrm {P} _ {t + m} = s_ {t} + m \ sigma _ {t}}

Metoda lui Brown

Din datele inițiale y 0 și y 1 , calculăm:

{\ displaystyle s '_ {0} = y_ {0}}

{\ displaystyle s '' _ {0} = y_ {0}}

{\ displaystyle s '_ {t} = \ alpha y_ {t} + (1- \ alpha) s' _ {t-1}}

{\ displaystyle s '' _ {t} = \ alpha s '_ {t} + (1- \ alpha) s' '_ {t-1}}

valoarea netezită pentru t ≥ 1 este:

{\ displaystyle a_ {t} = 2s '_ {t} -s' '_ {t}}

și estimarea tendinței:

{\ displaystyle b_ {t} = {\ frac {\ alpha} {1- \ alpha}} (s '_ {t} -s' '_ {t})}

Aplicarea netezirii exponențiale

Netezirea exponențială simplă, dublă sau chiar triplă a fost utilizată pe scară largă în procesarea analogică a semnalului. Această metodă este, de asemenea, utilizată pe scară largă, empiric pentru previziunile de vânzări, gestionarea stocurilor etc. Atât pentru procesarea digitală a semnalului în domeniul modelării, cât și al prognozării, au apărut metode mai puțin empirice, dar care necesită mai mult calcul, încă din anii 1970, pentru modelarea și previzionarea modelelor ARIMA (în) mai generale și mai bine fundamentate în teorie, implicit implică netezirea exponențială.

Implementarea software-ului

Limbaj R : metoda Holt-Winters în biblioteca de statistici și funcția ets în biblioteca de prognoză (implementarea completă duce la rezultate mai bune).
IBM SPSS include: netezire simplă și sezonieră, metoda tendinței Holt, tendința amortizată, metoda Winters pentru tendințele aditive și multiplicative în extensia procedurii de modelare statistică / modelare a seriei de timp .
Stata : comanda tssmooth
LibreOffice 5.2
Microsoft Excel 2016

Vezi și tu

Note și referințe

( fr ) Acest articol este preluat parțial sau în întregime din articolul din Wikipedia în engleză intitulat „ Exponential smoothing ” ( vezi lista autorilor ) .

Alan V. Oppenheim și Ronald W. Schafer, Digital Signal Processing , Upper Saddle River, NJ, SUA, Prentice Hall ,1975, 585 p. ( ISBN 0-13-214635-5 ) , p. 5.
(in) " Modele și exponentiala a valorii medii Smoothing " (accesat la 1 st ianuarie 2018 ) .
(în) Charles C. Holt, „ Previziuni privind tendințele și mediile exponențiale ponderate de sezon ” , Carnegie Institute of Technology, memorandumul Biroului de cercetare navală din Pittsburgh , nr . 52,1957.
(în) Peter R. Winters ' Forecasting Sales by Exponentially Weighted Moving Medies " , Management Science , vol. 6, n o 3,1 st aprilie 1960, pp. 324-342 ( citite online , accesat 1 st ianuarie 2018 ).
(în) Robert G. Brown, Netezire exponențială pentru prezicerea cererii , Cambridge, Massachusetts (SUA), Arthur D. Little Inc.1956( citește online ).
„ R: Holt-Winters Filtering ” , la stat.ethz.ch (accesat la 5 iunie 2016 )
" ets {prognoză} | în interiorul-R | Un site comunitar pentru R ” , pe www.inside-r.org (accesat la 5 iunie 2016 )
(ro-SUA) „ Compararea HoltWinters () și ets () ” , pe Hyndsight ,29 mai 2011(accesat pe 5 iunie 2016 )
Documentație pentru controlul tssmooth Stata
https://wiki.documentfoundation.org/ReleaseNotes/5.2#New_spreadsheet_functions
http://www.real-statistics.com/time-series-analysis/basic-time-series-forecasting/excel-2016-forecasting-functions/

Bibliografie

R. Bourbonnais și J.-C. Usunier , Prognoza vânzărilor , Economica ,2017, Ed. A 6- a ..

Articole similare