Estimarea mișcării

De estimare a mișcării sau de estimare a mișcării (în) este un proces care constă în studierea deplasarea obiectelor într - o secvență video, căutând corelația dintre două imagini succesive pentru a prezice modificarea poziției conținutului. Mișcarea este o problemă slab pusă în videoclip, deoarece descrie un context tridimensional, în timp ce imaginile sunt o proiecție a scenelor 3D într-un plan 2D. În general, este reprezentat de un vector de mișcare care descrie o transformare de la o imagine bidimensională la alta. Vectorii de mișcare leagă două blocuri prin proiectarea blocurilor pe aceeași imagine, adică coordonatele vectorului sunt definite doar spațial fără constrângeri de timp. Blocurile în cauză sunt diferite în funcție de algoritm: întreaga imagine poate fi legată de vector, așa cum este cazul pentru estimarea mișcării globale sau doar părți specifice ale imaginii, cum ar fi blocuri dreptunghiulare, forme arbitrare sau chiar pe pixel . Vectorii pot fi reprezentați de un model tradițional sau de multe alte modele care pot aproxima mișcarea unei camere video reale, cum ar fi rotația și translația în trei dimensiuni fără a uita de zoom . Această tehnică de predicție este utilizată în principal în compresia video , robotică și procesarea imaginilor . Există mai multe metode de estimare a mișcării, cele mai cunoscute fiind Block-Matching și Optical Flow .

Domenii de aplicare

În compresia video, estimarea mișcării face parte din procesul de predicție inter care încearcă să profite de redundanța temporală a imaginilor codificate anterior pentru a prezice mișcarea și astfel a comprima datele mai eficient decât prin predicția spațială . Din punct de vedere tehnic, algoritmul caută într-o așa-numită imagine de referință un bloc similar cu un bloc al imaginii sursă și înregistrează vectorul de mișcare care le conectează pentru a o codifica. Estimarea mișcării este urmată de compensarea mișcării care are ca scop aplicarea vectorilor de mișcare găsiți la imagine pentru a sintetiza transformarea imaginii următoare. Cu alte cuvinte, imaginea definită de blocurile vizate de vectori nu este în general identică cu imaginea sursă. Pentru a putea decoda o imagine, este necesar să se stabilească diferența dintre blocurile vizate și blocurile sursă și să se codeze. Este prezent în mai multe standarde video, inclusiv MPEG-1 , MPEG-2 și MPEG-4, precum și în multe codecuri video .

Estimarea mișcării este, de asemenea, utilizată pentru procesarea imaginilor pentru a viza obiecte și pentru a defini mai precis conturul acestora. Este legat în principal de tehnici de segmentare și filtrare într-o imagine.

În robotică, acest proces face posibilă prezicerea deplasării sau poziției obiectelor pentru a îmbunătăți interacțiunea modelului cu mediul extern.

Algoritmi existenți

Algoritmii de căutare pentru găsirea vectorilor de mișcare pot fi definiți în două categorii: așa-numitele metode directe bazate pe pixeli și așa-numitele metode indirecte bazate pe conținut .

Metode directe

Flux optic

Tehnica cea mai apropiată de estimarea mișcării se numește flux optic , ai cărui vectori corespund mișcării percepute la nivelul pixelilor. În estimarea mișcării, corespondența exactă a poziției pixelilor din fiecare imagine nu este o necesitate.

Potrivire bloc

Algoritmul Block-potrivire este o metodă de corelare excelentă pentru blocul care seamănă cel mai mult din imaginea de referință la blocul curent. Imaginea curentă este împărțită în blocuri non-suprapuse, de dimensiuni identice, care sunt văzute ca blocuri independente în care pixelii care compun fiecare bloc au același ritm de mișcare. Aplicația este în general limitată la o fereastră de căutare care este desenată în jurul blocului curent, din motive de performanță hardware. Pentru a determina cele mai bune blocuri similare, algoritmul compară diferența dintre blocul sursă și celelalte blocuri utilizând un criteriu de calitate precum SAD și blocul vizat care minimizează această regulă este păstrat.

Alte tehnici Măsuri de evaluare

Pentru a evalua cel mai bun vector de mișcare pentru un bloc, există mai multe criterii de evaluare pentru metodele directe:

Metode indirecte

Metodele indirecte utilizează conținut, cum ar fi detectorul Harris, și găsesc conținut similar între fiecare cadru, adesea cu o funcție statistică aplicată unei zone globale sau locale. Scopul acestei funcții este de a elimina zonele care nu corespund mișcării curente. Funcțiile statistice sunt, de asemenea, utilizate în metodele RANSAC .

Note și referințe

  1. (în) PHS Torr și A. Zisserman , „  Metode bazate pe funcții pentru estimarea structurii și mișcării  ” [PDF] pe ox.ac.uk (accesat la 26 ianuarie 2011 )
  2. (în) domnul Irani și P. Anandan, „  Totul despre metode directe  ” [PDF] pe wisc.edu (accesat la 26 ianuarie 2011 )

Anexe

Surse

  • (ro) EG Richardson, H.264 și MPEG-4 Compresie video: codare video pentru generația următoare Multimedia , Chichester, John Wiley & Sons Ltd.,Septembrie 2003( ISBN  0-470-84837-5 )

Articole similare