Poziționare multidimensională

Scalarea multidimensională este un set de tehnici de statistici utilizate în domeniul vizualizării informațiilor pentru a explora similitudinile în datele. Poziționarea multivariată este un caz special al analizei multivariate . De obicei, un algoritm de poziționare multidimensional începe de la o matrice de similaritate între toate punctele pentru a atribui fiecărui punct o poziție într-un spațiu dimensional. Pentru = 2 sau = 3, pozițiile pot fi vizualizate pe un plan sau într-un volum printr-un nor de puncte .

Cadrul general

Date puncte dintr-un spațiu dimensional , poziționarea multidimensională constă în reprezentarea acestor puncte într-un spațiu dimensional prin puncte noi , păstrând în același timp proximitățile. Pentru aceasta, ne oferim o matrice de distanță care poate fi definită de distanța euclidiană . Dacă plecăm de la valori de similitudine, trebuie să le transformăm în valori ale distanței matematice adevărate, deoarece trebuie să avem în vedere că distanța și similitudinea sunt noțiuni opuse: cu cât distanța este mai mică, cu atât este mai mare asemănarea și invers .. Prezentată în această lumină, poziționarea multidimensională este o tehnică de reducere a dimensiunii , precum analiza componentelor principale .

În practică, poziționarea multidimensională constă în găsirea unor vectori de dimensiuni care să minimizeze o funcție de cost numită stres .

Poziționare multidimensională metrică

O poziționare multidimensională metrică se referă la o funcție de cost definită de distanța euclidiană sau de produsul punct între puncte .

O funcție naturală de cost pentru poziționarea multidimensională este

dar această formulare nu are în general o soluție explicită.

Pozitionare clasica multidimensionala

Pentru poziționarea clasică multidimensională, funcția de cost este înlocuită cu

Termenul este definit de cu . În general, matricea , matricea de similaritate, poate fi obținută dintr-o matrice de distanță prin dublă centrare:

unde este o matrice de dimensiuni care conține doar una.

Această formulare are avantajul de a avea o soluție explicită prin descompunerea în elemente curate . Fie cele mai mari valori proprii și vectorii proprii corespunzători. Apoi, o soluție pentru poziționarea multidimensională este de a lua ca vectori coloanele matricei , unde este matricea vectorului propriu transpus și este matricea diagonală a valorii proprii.

Poziționare multidimensională nemetrică

Poziționarea multidimensională nemetrică se referă la metodele care favorizează ordinea proximităților în locul conservării distanțelor. Funcția de cost care trebuie minimizată este

.

Funcția este permisă să se adapteze în timpul optimizării. Pentru a face acest lucru, putem calcula o regresie monotonă a punctelor .

Vezi și tu

Note și referințe

  1. Alain Baccini și Philippe Besse, Explorare statistică, capitolul 7
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">