Tweeturi indigene

Tweets indigene este un site web care arhivează și afișează mesaje Twitter ( tweets ) postate în anumite limbi minoritare . Inițial, site-ul se concentra asupra limbilor indigene și urmărea să ajute indigenii să se conecteze între ei. Ulterior, site-ul s-a deschis către limbile minorităților non-indigene.

Pe pagina sa de pornire , site-ul afișează o listă a limbilor minoritare ale căror tweeturi le-a înregistrat . După selectarea unei limbi, utilizatorul este dus la un tabel cu toți oamenii care au postat pe Twitter în limba respectivă. Site-ul oferă imaginea de profil a fiecărui adept de Twitter, precum și statistici privind numărul de persoane care îi urmăresc. Site-ul oferă, de asemenea, procentul de tweets pe care acest abonat le-a postat în diferite limbi și are o selecție de teme de tendință în diferite limbi minoritare.

Istorie

Site-ul a fost creat în martie 2011Kevin Scannell, cercetător în lingvistică computațională la Departamentul de Informatică al Universității din St. Louis , St. Louis , Missouri , Statele Unite .

Când a fost creat în martie 2011, site-ul enumeră 35 de limbi minoritare. 16 aprilie 2011, tweet-uri au fost postate în 76 de limbi. 26 aprilie, site-ul a fost interesat de 82 de limbi. Aceste limbi includ camilaroi, precum și limbi mai cunoscute, cum ar fi creolul haitian și basca, care au ocupat, respectiv, primul și al doilea loc în clasamentul limbilor cu cele mai multe twittere, locul al treilea a fost în galeză . Îniunie 2015, Creolul haitian a fost detronat de bască și kiswahili .

Exploatarea datelor

Tweets indigene utilizează o bază de date de cuvinte și fraze pentru a identifica persoanele care vorbesc limbile minoritare enumerate. În timpul unui interviu înaprilie 2011La BBC , Scannell a spus că a petrecut 8 ani construind o bază de date de aproape 500 de limbi, examinând bloguri , articole din ziare și site-uri web .

„Mulți oameni privesc cu îngrozire tehnologia și lucruri precum traducerea automată și rețelele sociale, deoarece consideră că va promova extinderea unei limbi universale, precum și a culturii americane și engleze. Am văzut lucruri precum Twitter și social media ca o oportunitate pentru limbile minoritare. Un site web precum Indigenous Tweets este un bun exemplu de site web care permite oamenilor să se conecteze și să comunice în propria limbă în mod natural online. "

- Kevin Scannell, aprilie 2011

Site-ul clasifică tweeturile căutând în baza de date cuvinte și fraze specifice anumitor limbi minoritare. Instrumentul de clasare a site-ului nu poate identifica limba unui tweet dintr-un cuvânt dacă acel cuvânt există în mai multe limbi. Pentru a evita problema, Scannell folosește doar cuvinte și fraze în baza sa de date care apar într-o limbă.

Referințe

  1. Lee, Dave, „  Microblogging în limba maternă pe Twitter  ”, BBC News ,8 aprilie 2011( citiți online [ arhiva de22 aprilie 2011] , accesat la 22 aprilie 2011 )
  2. Scannel, Kevin, „  Site-ul lui Kevin Scannell  ” , Universitatea din Saint-Louis ,2012(accesat la 11 mai 2012 )
  3. "האם האינטרנט יציל את הקולות שהוא משתיק" Haaretz (în ebraică). arhivat din original la 22 aprilie 2011. Accesat la 22 aprilie 2011.
  4. Martín, Javier (16-04-2011). „Rastreando lenguas minoritarias”. El País. arhivat din original la 22 aprilie 2011. Accesat la 22 aprilie 2011.
  5. „Prezervarea limbilor indigene prin Twitter”. Arhivat din original la 22 aprilie 2011. Accesat la 22 aprilie 2011