Scalarea multidimensională este un set de tehnici de statistici utilizate în domeniul vizualizării informațiilor pentru a explora similitudinile în datele. Poziționarea multivariată este un caz special al analizei multivariate . De obicei, un algoritm de poziționare multidimensional începe de la o matrice de similaritate între toate punctele pentru a atribui fiecărui punct o poziție într-un spațiu dimensional. Pentru = 2 sau = 3, pozițiile pot fi vizualizate pe un plan sau într-un volum printr-un nor de puncte .
Date puncte dintr-un spațiu dimensional , poziționarea multidimensională constă în reprezentarea acestor puncte într-un spațiu dimensional prin puncte noi , păstrând în același timp proximitățile. Pentru aceasta, ne oferim o matrice de distanță care poate fi definită de distanța euclidiană . Dacă plecăm de la valori de similitudine, trebuie să le transformăm în valori ale distanței matematice adevărate, deoarece trebuie să avem în vedere că distanța și similitudinea sunt noțiuni opuse: cu cât distanța este mai mică, cu atât este mai mare asemănarea și invers .. Prezentată în această lumină, poziționarea multidimensională este o tehnică de reducere a dimensiunii , precum analiza componentelor principale .
În practică, poziționarea multidimensională constă în găsirea unor vectori de dimensiuni care să minimizeze o funcție de cost numită stres .
O poziționare multidimensională metrică se referă la o funcție de cost definită de distanța euclidiană sau de produsul punct între puncte .
O funcție naturală de cost pentru poziționarea multidimensională este
dar această formulare nu are în general o soluție explicită.
Pentru poziționarea clasică multidimensională, funcția de cost este înlocuită cu
Termenul este definit de cu . În general, matricea , matricea de similaritate, poate fi obținută dintr-o matrice de distanță prin dublă centrare:
unde este o matrice de dimensiuni care conține doar una.
Această formulare are avantajul de a avea o soluție explicită prin descompunerea în elemente curate . Fie cele mai mari valori proprii și vectorii proprii corespunzători. Apoi, o soluție pentru poziționarea multidimensională este de a lua ca vectori coloanele matricei , unde este matricea vectorului propriu transpus și este matricea diagonală a valorii proprii.
Poziționarea multidimensională nemetrică se referă la metodele care favorizează ordinea proximităților în locul conservării distanțelor. Funcția de cost care trebuie minimizată este
.Funcția este permisă să se adapteze în timpul optimizării. Pentru a face acest lucru, putem calcula o regresie monotonă a punctelor .