Logometrie

Logométrie ( logo - uri = discursul metry = măsură) este o metodă de analiză și interpretare a vorbirii utilizate în științelor umane și sociale ( lingvistică , istorie , literatură , sociologie , etc.). Această metodă de analiză asistată de computer combină citirea calitativă și citirea cantitativă a corpurilor digitale. De asemenea, combină lectura globală (tot discursul) și lectura locală (unitățile de vorbire) pentru a construi interpretarea.
Epistemologic, logometry se referă la analiza discursului , a lingvisticii de texte și semantica de corpora . Din punct de vedere tehnic, se bazează pe hipertextualitatea corpurilor digitale ( navigare hipertextuală , index , concordant ), pe de o parte, și pe analiza datelor și a statisticilor textuale (tabelul de frecvențe și distribuția vocabularului, calculul distanței intertextuale, clasificare , co- apariții etc.) pe de altă parte.
Logometria este prezentată ca o extensie naturală a lexicometriei (măsurarea lexiconului) și a textometriei (măsurarea textului). Cu toate acestea, obiectul său este discursul sau logosul (discursul politic, discursul literar, discursul mediatic, discursul științific) în dimensiunile sale lingvistice și sociale.

Istoria metodei

Logometria se dezvoltă în secolul XXI  ca parte a științelor umaniste digitale . Cu toate acestea , înscrise în franceză și internațională istorie datând instrumentarea analizei discursului de calculator de la mijlocul XX - lea  secol și dezvoltarea statistică a textului din 1960-1970 de ani. Ca pionieri, îi cităm pe Zellig Harris , precum și pe Michel Pêcheux , Jean-Paul Benzécri în rolul lui Charles Muller, Jean Dubois în rolul lui Pierre Guiraud , Maurice Tournier și Étienne Brunet .
Dezvoltarea sa actuală beneficiază de multiplicarea și disponibilitatea corpurilor digitalizate, dezvoltarea și utilizarea de software adecvat ( Alceste , Hyperbase , Iramuteq, Lexico , TXM etc.) și maturizarea științifică a analizei vorbirii în SHS ( rândul său lingvistic , viraj hermeneutic, semantica corpusului).

Definiție

Pentru Francine Mazière în Que sais-je? în ceea ce privește analiza discursului , logometria este mai presus de toate o „revenire” asistată de computer la unitățile de discurs pentru a consolida interpretarea. Pentru Laurent Rouveyrol, este o metodă deschisă și „integrativă” al cărei „obiect esențial este să dea seama de relativitatea strategiilor discursive” puse în aplicare de către vorbitori . Pentru lingvistul Pierre Fiala, logometria este o extindere ambițioasă a textometriei, dar „încă departe de un tratament transversal al textelor”. Damon Mayaffre, la rândul său, definește logometria în teza sa de Împuternicire a cercetării directe ca o metodă interpretativă (articulare globală / locală; obiectivarea căilor interpretative) a cărei subliniază instrumentele lingvistice, computerizate și statistice în continuitate, dar depășind lexicometria tradițională:

„Un set de procesare documentară și statistică a textului și a discursurilor cărora nu le este interzis nimic pentru a autoriza totul; care depășește tratamentul formelor grafice fără a le exclude sau uita; care analizează leme sau structuri gramaticale fără a abandona textul nativ la care suntem întotdeauna referiți. Este în cele din urmă o prelucrare globală (semi) automată a textului în toate dimensiunile sale: grafică, lematizată, gramaticalizată. Analiza se va referi astfel la toate unitățile lingvistice ale literei către izotopii, trecând pe lângă n-grame, cuvinte, leme, co-apariții, coduri gramaticale, bi-coduri sau lanțuri sintactice.  "

Domeniu de aplicare și sprijin instituțional

Logometria se distinge pe de o parte de procesarea automată a limbajului natural (NLP), extragerea textului sau analiza conținutului prin preocuparea sa filologică și lingvistică specializată pentru texte și discursuri: corpurile analizate colectează discursuri în mod corespunzător. Identificate și criticate de analistul care intenționează să producă o analiză socio-lingvistică detaliată.

Logometria diferă de lingvistica textuală tradițională sau de analiza discursului prin metodologia sa computerizată și prin utilizarea statisticilor .

Logometria extinde lexicometria și textometria prin definirea discursului (logos), după lexicon și text , ca obiect al acestuia.
Prezent în mai multe universități, beneficiile logometriei la Universitatea din Nisa Sophia Antipolis de la o echipă de cercetare CNRS și un site dedicat: Logometrie și corpus politic, media și literar ( UMR 7320, Bases, Corpus, Language).

Principii și valori

Logometria afișează două principii fundamentale: contextualizarea unităților și măsurarea regularității acestora în corpus; este deci o chestiune de citit , precum și de numărare .

  1. Contextualizare  : semnificația unităților de discurs provine din contextele lor de utilizare. Prin utilizare definim sensul cuvintelor. Convocarea pasajelor din corpus și revenirea la text, echipate cu prelucrarea datelor ( indexare și motor de căutare ), devin astfel o prioritate pentru analizele logometrice.
  2. Regularitate și evidență  : valoarea unităților de discurs provine din regularitatea sau neregularitatea utilizării lor în corpus. Absența, frecvența, repetarea, distribuția sunt indicii cantitativi esențiali (tabelul frecvențelor , abordarea probabilistică a vocabularului, analiza factorială a corespondenței tabelelor lexicale, calculul co-aparițiilor etc.) în procesul interpretativ.

Logometria susține că are două valori: descriptivă și euristică; este deci la fel de mult o problemă de atestare, cât de interpretare , de constatare decât de căutare .

  1. Descriere  : computerul este chemat să producă cea mai sistematică și exhaustivă descriere posibilă a corpurilor digitale mari. În cel mai bun caz, această descriere exhaustivă poate lua valoare probatorie.
  2. Euristică  : citirea digitală și prelucrarea statistică ar trebui să permită furnizarea unor chei interpretative diferite și neașteptate în comparație cu citirea naturală și oculară a textelor. Cel mai adesea, citirea logometrică are deci o valoare euristică, hermeneutică, sugestivă.

Domenii de aplicare

Deoarece discursul este el însuși un obiect interdisciplinar conform teoreticienilor analizei discursului , domeniul studiilor logometrice este variat:

Software

Software-ul universitar pentru analiza vorbirii este abundent. Cele pe care le solicită logometria permit atât prelucrarea statistică, cât și revenirea la text. Ei trebuie să ofere panoplia instrumentelor dezvoltate din anii 1980 până astăzi pentru a explica corpusul ( indicele de frecvență, dicționar, calculul vocabularului specific, concordanța , tratamentul aparițiilor și co-aparițiilor, clasificarea statisticilor multidimensionale ( AFC ) , grafice și rețele de cuvinte , etc.). De exemplu :

Bibliografie multidisciplinară

Referințe

  1. „  software Alceste  ” , pe www.image-zafar.com (accesat la 18 august 2016 )
  2. Francine Mazière, Analiza discursului , Paris, PUF, 2005, p.  110 .
  3. Laurent Rouveyrol, Către o logometrie integrativă a corpusului politic mediat. Exemplul subiectivității în dezbaterile britanice, Corpus , nr .  4, 2005
  4. Pierre Fiala, Mots , n o  80, 2006, p.  134
  5. Damon Mayaffre , Către o hermeneutică materială digitală. Corpus textual, logometrie și limbaj politic . Teza de abilitare pentru cercetarea directă, susținută la Nisa, 30 aprilie 2010, îndrumată de Sylvie Mellet, vol. 1, p. 22 ( http://tel.archives-ouvertes.fr/tel-00655380 ).
  6. http://logometrie.unice.fr/ și http://www.unice.fr/bcl/
  7. Cf. de exemplu indexurile și concordanțele publicate de Étienne Brunet , Le Vocabulaire de Proust , cu Indexul complet și sinoptic al căutării timpului pierdut , 3 vol., 1918 p., Genève-Paris, Slatkine-Champion, 1983. ( ISBN  2051004749 și 9782051004749 ) . Vocabularul lui Zola , urmat de Indexul complet și sinoptic al lui Rougon-Macquart, 3 volume, 472 p., 646 p., 357 p. și 5500 de pagini pe microfișe standard, Geneva-Paris, Slatkine-Champion, 1985 ( ISBN  2-05-100670-9 ) . Le Vocabulaire de Victor Hugo , vol. 1, 484 p., Vol. 2, 637 p., Vol. 3, 556 p., + 27 microfișe standardizate care conțin Indexul sinoptic al operelor lui Hugo (6878 p.), Genève-Paris, Slatkine-Champion, 1988. ( ISBN  2051010048 și 9782051010047 ) . index
  8. P. Charaudeau și D. Maingueneau (dir.), Dicționar de analiză a discursului , Paris, Seuil, 2002 ( ISBN  2020378450 )
  9. Pentru statistici textuale, cf. lucrarea de referință: Lebart, L. și Salem, A. (1994). Statistici textuale . Paris, Dunod, online: http://lexicometrica.univ-paris3.fr/livre/st94/
  10. Hyperbase 10.0 (2015): http://ancilla.unice.fr/
  11. http://iramuteq.org/  : http://iramuteq.org/
  12. http://www.tal.univ-paris3.fr/trameur/
  13. Lexico: http://www.tal.univ-paris3.fr/lexico/
  14. TXM: http://textometrie.ens-lyon.fr/

Vezi și tu

Articole similare

linkuri externe