Co-apariție

Co-apariție (fără cratimă în franceză) este prezența simultană a două sau mai multe cuvinte sau alte unități lingvistice în aceeași declarație, de exemplu, teză, punctul, extract.

Disciplinele precum istoria sau geografia sunt, de asemenea, interesate de coincidența cuvintelor sau a toponimelor în timp și spațiu.

Un concept înrudit este „  colocarea ” care este o formă de expresie idiomatică cauzată de co-apariția sistematică.

Elemente definitorii

Cuvântul co-apariție poate avea mai multe semnificații.

Cuvintele „co-apariții” nu sunt neapărat legate prin relații formale sau sintactice (sintagme fixe, expresii, colocații ), prin sinonimie , antonimie sau chip ( hiperonimie sau meronimie ), dar totuși au neapărat o anumită legătură lingvistică.

Când cele două cuvinte - sau alte unități lingvistice - au o relație semantică strânsă sau îndepărtată, noțiunea de co-apariție stă la baza celei de câmp tematic, lexical sau izotopie .

Probleme, utilizări

Această noțiune este utilizată în domenii la fel de variate ca

Detectare, analiză textuală

Când cele două cuvinte - sau alte unități lingvistice - au o relație semantică strânsă sau îndepărtată, noțiunea de co-apariție stă la baza celei de câmp tematic, lexical sau izotopie .

Analiza datelor textuale insistă asupra relațiilor statistice că cele două co-ocurențe trebuie să mențină, și - a propus mai multe indicii pentru a calcula corect atracția observată. Co-apariția devine apoi coprezența semnificativă statistic a două sau mai multe unități în aceeași fereastră pop-up.

Există programe software pentru detectarea automată a expresiilor și a altor coincidențe; sunt programe lexicometrice, textometrice și logometrice care oferă numeroase reprezentări ale coincidențelor în corpusuri textuale etichetate sau texte simple (extrag coincidențe sub formă de liste simple, grafice, rețele sau rețele ). Printre aceste programe software, de exemplu, se numără:

etc.

Cercetare

Cercetătorii încearcă să definească mai bine acest concept și provocările sale în funcție de domeniile de aplicare (exacte, științele umane și sociale) și de scala de evaluare (spațială, temporală, abstractă). De asemenea, ei caută să dezvolte metode care să evalueze mai bine calitatea co-apariției și să o măsoare mai bine cantitativ.

Exemple de cuvinte care apar simultan

Note și referințe

  1. Matthias Tauveron (2012) De la co-apariție generalizată la variație a sensului lexical , în Co-apariție, de la fapt statistic la fapt textual (Damon Mayaffre și Jean-Marie Viprey, eds), CORPUS, 11, 2012
  2. Manning C., Schütze H (1999) Fundamente ale procesării statistice a limbajului natural , Cambridge (Mass.); Londra: MIT Press
  3. Foltête Jean-Christophe (2003) Reconstrucția unei difuzii spațiale dintr-o succesiune de state ; Spațiu geografic, 2003/2 (volumul 32), p.  171–183
  4. Salazar-orvig Anne, Mișcările discursului. Stil, referință și dialog în interviurile clinice , Paris, L'Harmattan, 1999, 294 p.
  5. Xu, J. și Croft, WB (1998) Corpus-based derivat folosind co-apariția variantelor de cuvinte . Tranzacții ACM pe sisteme informaționale (TOIS), 16 (1), 61-81.
  6. Veyne Paul (1971) Cum se scrie istorie. Eseu epistemologic Paris, Ed. Du Seuil 352 pagini.
  7. Pisetta Vincent, Hacid Hakim, Bellal Fazia, Ritschard Gilbert și A. Zighed Djamel (2006) Prelucrarea automată a textelor legale , în R. Lehn, M. Harzallah, N. Aussenac-Gilles, J. Charlet (eds), Weeks of cunoștințe , SdC 2006, Nantes 26-30 iunie (Proceduri digitale pe Cd-Rom)
  8. Matthias Tauveron (2012) De la co-apariție generalizată la variație a sensului lexical, în Co-apariție, de la fapt statistic la fapt textual (Damon Mayaffre și Jean-Marie Viprey, eds), CORPUS, 11, 2012
  9. Moalla Koubaa Ikram (2009) Caracterizarea scrierilor medievale prin metode statistice bazate pe co-apariții . Teza de informatică, INSA Lyon.
  10. Moscovici Serge și Henry Paul (1968) Problems of content analysis (, Languages, socio-linguistics, Vol. 3, n o  11, p.  36-60
  11. Schütze, H. și Pedersen, JO (1997) Un tezaur bazat pe coocurență și două aplicații pentru recuperarea informațiilor . Procesarea și gestionarea informațiilor, 33 (3), 307-318.
  12. Matsuo, Y., și Ishizuka, M. (2004). Extragerea cuvintelor cheie dintr-un singur document folosind informații statistice privind coincidența cuvintelor . Jurnal internațional privind instrumentele de inteligență artificială, 13 (01), 157-169.
  13. Globerson Amir, Chechik Gal, Pereira fernando, Naftali Tishby (2007) Euclidean Embedding of Co-occurrence Data , Journal of Machine Learning Research 8 (2007), p.  2265-2295
  14. Manning C., Schütze H. (1999) Bazele procesării statisticului limbajului natural , Cambridge (Mass.); Londra: MIT Press
  15. Prévost Marie & Debruille Jacques Bruno (2013) Co-apariția credințelor religioase, superstițioase și delirante , Santé Mental au Québec, Volumul 38, numărul 1, primăvara 2013, p.  279-296
  16. „  Alceste software  ” , la www.image-zafar.com (accesat la 18 august 2016 )
  17. Josselin D (2014) Anunțarea seminarului transdisciplinar „ Cooccurrences & co. ”(Avignon 5 decembrie 2014), publicat în octombrie 2014

Vezi și tu

Articole similare

Noțiuni similare

În funcție de domeniu, această noțiune este mai mult sau mai puțin similară sau este legată de noțiuni similare, inclusiv de exemplu

Bibliografie