Analiza similitudine este o metodă de analiză a datelor , ca parte a unei abordări a rezultat teoria grafurilor și se bazează pe găsirea de asemănări sau deosebiri. Această abordare face posibilă nu crearea categoriilor a priori și, mai degrabă, construirea categoriilor care urmează să fie analizate din asemănări formale între entitățile din cadrul unei rețele.
În analiza rețelei , două entități (vârfurile unui grafic ) se spune că sunt similare sau echivalente atunci când aceleași relații le leagă de alte entități (sau actori) ale rețelei. Există trei abordări de bază pentru măsurarea similitudinii și distanței dintre entitățile din cadrul unei rețele.
Cercetarea științelor sociale implică în general recurgerea la categorii sociale sau „ clase sociale ” deja construite și predefinite de cercetători, pe baza atributelor comune: „ tineri ”, „ manageri ”, „ țări ”, „ șomeri ”, „ femei ” etc. . Odată cu analiza similarității, aceste categorii nu sunt fixate a priori, ci sunt făcute vizibile prin unul sau mai multe procese care fac posibilă clasificarea și gruparea cazurilor analizate, în funcție de relațiile lor eficiente - cine face ce, cine vorbește cu cine, unde, pe ce, cu cine etc. .
Similaritatea în analiza rețelei apare atunci când două vârfuri (sau mai multe, în funcție de structura analizată) se găsesc în aceeași clasă de echivalență . Cu alte cuvinte, entitățile sociale sau pozițiile sociale din aceeași clasă de echivalență fuzionează pe baza relațiilor pe care le întrețin cu ceilalți, cum ar fi, de exemplu, medicii care au pacienți în urmărire.
Există trei abordări de bază pentru a produce o măsură de similaritate în cadrul unei rețele : echivalența structurală, echivalența automorfă și echivalența regulată. Aceste trei noțiuni de echivalență sunt ierarhice: fiecare set în echivalență structurală este, de asemenea, în echivalență automorfă și în echivalență regulată, fiecare set în echivalență automorfă este în echivalență regulată, dar toate echivalențele regulate nu sunt neapărat automorfe sau structurale și toate echivalențele automorfe nu sunt neapărat structurale.
Două vârfuri ale unei rețele sunt structural echivalente dacă legăturile lor cu celelalte vârfuri sunt similare.
În imaginea de mai jos, niciun alt vârf (sau nod) nu are exact același set de legături ca A care, prin urmare, aparține unei clase specifice. Același lucru este valabil și pentru vârfurile B, C, D și G (fiecare dintre aceste vârfuri are „setul” său specific de legături cu alte vârfuri). Cu toate acestea, E și F, se află în aceeași clasă de echivalență structurală, deoarece ambele au același model de legături (o legătură cu B), se spune că sunt în echivalență structurală. Același lucru este valabil și pentru H și I, ambii având o legătură cu D.
Echivalența structurală este cea mai puternică formă de similaritate. În realitate, în rețelele sociale echivalența pură este rară și este util să se utilizeze criterii mai puțin stricte pentru a măsura o echivalență aproximativă.
Un concept apropiat de cel al echivalenței structurale este cel al echivalenței instituționale: două vârfuri (de exemplu, două companii ) sunt echivalente instituțional dacă operează în același domeniu instituțional. În timp ce vârfurile echivalente din punct de vedere structural au modele relaționale sau poziții de rețea identice, echivalența instituțională reflectă similitudinea influențelor instituționale pe care vârfurile le experimentează în aceleași domenii și spații, indiferent de similaritatea pozițiilor lor în rețea. De exemplu, două bănci din Chicago pot avea modele de relații foarte diferite (una poate fi un vârf central și cealaltă poate fi într-o poziție periferică), deci nu sunt echivalente structurale, ci pentru că „Ambele operează în domeniul finanțelor și în aceeași zonă definită geografic (Chicago), vor fi supuși acelorași influențe instituționale.
Definiție formală de Karl Reitz și Douglas White (1989): Fie un set și o relație binară în . , relația de echivalență, este o echivalență structurală, dacă și numai dacă, pentru toate acestea , implică:
Similaritatea cosinus a și este numărul de vecini comuni împărțit la media geometrică a lor de grade. Această valoare oscilează între 0 și 1. Valoarea 1 indică faptul că cele două vârfuri au exact același vecinătate, în timp ce valoarea 0 înseamnă că nu au vecini în comun. Similitudinea cosinusului este nedefinită din punct de vedere tehnic dacă unul sau ambii vârfuri au gradul 0, dar conform convenției, se spune că similitudinea cosinusului este 0 în aceste cazuri.
Coeficientul PearsonCoeficientul de corelație Pearson este o metodă alternativă de a standardiza numărătoarea vecinilor comuni. Această metodă compară numărul vecinilor obișnuiți cu valoarea așteptată într-o rețea în care vârfurile sunt conectate aleatoriu. Această valoare este strict între -1 și 1.
distanta euclidianaDistanța euclidiană este egală cu numărul de vecini care diferă între două vârfuri. Aceasta este mai mult o măsură de diferențiere, deoarece este mai mare pentru vârfurile care diferă cel mai mult. Poate fi normalizat prin împărțirea la valoarea maximă. „Maxim” înseamnă că nu există vecini comuni, caz în care distanța este egală cu suma gradelor vârfurilor.
În mod formal „Două vârfuri sunt echivalente automat, dacă toate vârfurile pot fi redenumite pentru a forma un grafic izomorf cu eticheta și schimbate. Două vârfuri echivalente automorf partajează exact aceleași proprietăți independente de etichetă. "
Mai intuitiv, entitățile sociale sunt în echivalență automorfă dacă este posibil să permutăm graficul astfel încât schimbul de două entități să nu aibă efect asupra distanțelor dintre alte entități din grafic.
În imaginea opusă, reprezentând o structură organizațională, A se află la stația centrală, B, C și D răspund de la A și acționează pe E, F și H, I; G este izolat, deși răspunde la C (și A). Deși actorii B și D nu sunt echivalenți din punct de vedere structural - au același respondent (A), dar nu aceleași legături cu ceilalți - par a fi totuși echivalenți. Ambele (B și D) răspund de la A și interacționează cu două entități (respectiv EF și HI). Dacă vârfurile B și D ar fi schimbate sau dacă am schimba E și H (precum și celelalte combinații posibile) distanțele dintre vârfurile din rețea ar rămâne exact aceleași. Deci , există 5 clase de echivalență automorphic în acest grafic: , , , , și . Trebuie remarcat faptul că o definiție mai puțin strictă a acestei echivalențe reduce numărul de clase.
Definiție formală de Karl Reitz și Douglas White (1989): Să fie un set și o relație binară în . , relația de echivalență, este o echivalență puternică sau automorfă, dacă și numai dacă, pentru toate , implică:
În mod formal, „doi actori sunt în mod regulat echivalenți dacă sunt legați și de echivalenții lor”. Cu alte cuvinte, vârfurile echivalente în mod regulat sunt vârfuri care, deși nu împărtășesc același cartier, împărtășesc cartiere care sunt ele însele similare.
De exemplu, două mame sunt echivalente , deoarece fiecare dintre ele are un model de relație similară cu lor căsătorie partener , copii , etc. Două mame nu sunt neapărat înrudite cu - sau cu - același partener și nici cu aceiași copii, deci nu sunt echivalente din punct de vedere structural. Și întrucât fiecare mamă poate avea un număr variabil de copii și / sau parteneri, nici ei nu se află în echivalență automorfă. Dar ele sunt similare, deoarece au același tip de relații cu alte seturi de entități sociale (de asemenea, ele sunt considerate echivalente în mod regulat, deoarece sunt similare în tipurile lor de legături cu entitatea „părinte”).
În graficul prezentate mai jos contra, există trei clase de echivalență regulate: , ,
Definiție formală de Karl Reitz și Douglas White (1989): Să fie un set și o relație binară în . , relația de echivalență, este o echivalență regulată , dacă și numai dacă, pentru toate , implică:
Datele de partiționare , gruparea ierarhică a vârfurilor bazate pe similaritatea profilurilor lor de legături cu alte vârfuri oferă un arbore de joncțiune sau o dendrogramă utilizată pentru a vizualiza gradul de asemănare între cazuri - și pot fi utilizate pentru a găsi clase aproximative de echivalență.
Utilizarea analizelor de echivalență face posibilă identificarea și vizualizarea claselor sau grupărilor de clase . Folosind analiza grupărilor ierarhice , se presupune implicit că asemănările sau distanțele dintre cazuri reflectă o singură dimensiune subiacentă. Cu toate acestea, este posibil să existe multe „aspecte” sau „dimensiuni” care stau la baza asemănărilor observate. Factorii sau componentele analizei pot fi aplicați corelațiilor sau covarianței dintre cazuri. Alternativ, poate fi utilizată poziționarea multidimensională (nemetrică pentru datele care sunt inerent nominale sau ordinale; metrică pentru datele evaluate).
Poziționarea multidimensională reprezintă modele de asemănare sau diferență în profilul legăturii dintre vârfuri (atunci când este aplicat adiacenței sau distanțelor), cum ar fi o „hartă” în spațiul multidimensional. Această hartă arată cât de apropiate sunt vârfurile, dacă se strâng împreună în spațiu și cât de puternică (sau nu) este variația între fiecare dimensiune.
Blockmodeling este o tehnică care clasifică legăturile matricei adiacenta pentru grupa același tip de relație; ceea ce face posibilă reorganizarea matricilor pentru a detecta similitudini (cf. Matrice prin blocuri ). Definiția din 1971 de Lorrain și White este: „vârfurile a și b sunt echivalente din punct de vedere structural, dacă sunt conectate la alte vârfuri în același mod” .
Utilizarea rețelei Galois pe matrici bipartite de date socio-semantice face posibilă gruparea după asemănări, în timp ce se clasifică relațiile.
Analiza similarității permite datelor să-și caracterizeze propriile structuri (cum ar fi clici , ierarhii sau o echivalență , de exemplu), în locul cercetătorului însuși și a categoriilor determinante a priori pentru analiză, cum ar fi acest lucru în general în științele sociale . Astfel, cercetătorul nu determină categoriile sociale și cine le aparține sau nu, are loc a posteriori al analizelor asemănărilor; cazurile supuse analizei sunt grupate în funcție de atributele lor comune, ceea ce face posibilă detectarea regularităților (sau chiar a „neregulilor”).
În analiza rețelei, clasele de echivalență sunt văzute ca fiind în interacțiuni corelative; „adică cei în care partenerii nu sunt indivizi similari plasați într-o anumită situație, ci indivizi care sunt definiți de rolul pe care îl joacă în interacțiune”. Împreună, produc un fapt social .
Interacțiunile corelative sunt inegale din punct de vedere structural, deoarece protagoniștii au poziții complementare în interacțiunea și producerea faptului social : „Este o interacțiune care, în principiu, este asimetrică” . Această noțiune ne permite să vorbim despre relațiile și rolurile sociale .
Exemple de interacțiuni corelative:
Colaborarea și concurența implică comparabilitate.
Metodele de analiză a similitudinilor relaționale nu sunt utilizate doar în științele sociale , este, de asemenea, una dintre procedurile utilizate de ANS , în criminalistică , în analiza automată a corpurilor mari sau a imaginilor , precum și în biologie .