Traducerea automată se referă la traducerea bruta a unui text realizat în întregime de către unul sau mai multe programe de calculator . În cazul traducerii unei conversații audio, live sau înregistrată, vorbim de transcriere automată . Un traducător uman nu intervine pentru a corecta erorile de text în timpul traducerii, ci doar înainte și / sau după. Se distinge de traducerea asistată de computer, unde traducerea este parțial manuală, posibil interactiv cu mașina.
În ciuda slăbiciunilor sale, poate oferi servicii în domenii precum ceasul internațional (inclusiv cel tehnologic ), unde permite cunoașterea superficială, dar rapidă a unor cantități mari de texte.
De la începutul secolului, traducerea automată a cunoscut o creștere considerabilă pe web , cu mai multe sisteme online capabile să traducă automat pagini Web sau texte din ce în ce mai lungi în câteva secunde. Este un ajutor mult apreciat de către publicul larg, deoarece permite descifrarea - într-un mod grosolan - a temei unei pagini web într-un limbaj complet necunoscut și a principalelor fapte sau informații care le conține. Pentru a simplifica navigarea, mai multe motoare de căutare precum Google , Altavista sau Yahoo! permiteți-i utilizarea sistematică.
Sfârșit Octombrie 2005, presa anunță îmbunătățiri notabile. Centrul Internațional pentru Tehnologii Avansate de Comunicații, condus în comun de Universitatea Carnegie-Mellon din Pittsburgh și Universitatea din Karlsruhe din Germania, dezvăluie un sistem computerizat de traducere instantanee. Un student chinez, împodobit cu unsprezece electrozi pe față și gât, susține un discurs în propria limbă, care este tradus simultan în engleză și spaniolă. Cercetătorii concluzionează că „Rezultatele nu sunt perfecte” și că „uneori pot apărea dificultăți”. De fapt, niciun articol nu indică faptul că jurnaliștii germani și americani au putut discuta cu studentul. În general, jurnaliștii omit să precizeze că, atunci când doctorul Waibel anunță că va lua întrebări de la jurnaliștii germani și americani, computerul aude ceva de genul: „Deci noi glicogenul, alternând întrebări între Germania și America. Acest tip de traducere instantanee încă nu are îmbunătățiri software în ceea ce privește recunoașterea vorbirii , în special amestecate de zgomotul ambiental și pronunția slabă.
În 2018, un instrument computerizat bazat pe inteligență artificială a reușit să traducă în douăsprezece ore o carte de 800 de pagini de text , grafică și formule matematice , scrisă cu LaTeX . Acest instrument dezvoltat de Quantmetry, o tânără firmă de consultanță în domeniul inteligenței artificiale pentru companii, asociat cu patru cercetători francezi specializați în învățarea profundă și de la ENSAI , INRIA și Universitatea din Caen , se bazează pe serviciul de traducere automată DeepL .
Metoda învățării profunde și avansarea traducerii automate inspirate de modul în care funcționează creierul uman se bazează pe traducerea automată neuronală, denumită în mod obișnuit NMT în limba engleză „ Neural Machine Translation ”.
În 2019, unul dintre serviciile de vârf din domeniu este DeepL de la Linguee, dar acest serviciu ar putea fi depășit de alte progrese de la Google.
În 2010, Pangeanic a devenit prima companie din lume care a aplicat traducătorul statistic Moses într-un mediu comercial prin dezvoltarea unei platforme de auto-învățare, curățare și reciclare a corpusurilor în colaborare cu Instituto Técnico de Informática de Valencia (ITI) și cercetarea grup Recunoașterea formelor și tehnologiei limbajului uman al Politècnica de València. Membru fondator al TAUS, Pangeanic a câștigat cel mai mare contract de infrastructură de traducere automată pentru Comisia Europeană cu proiectul său IADAATPA în 2017. Din 2019, Pangeanic conduce NTEU.eu , un proiect CEF al Comisiei Europene. NTEU este cea mai mare fermă de motoare de traducere automată bazată pe rețele neuronale pentru administrațiile publice europene.
Din 2020, Google a făcut traducerea automată a vorbirii sau conversației orale accesibile de pe telefoanele mobile.
Traducerea automată diferă de transcrierea automată, deoarece traducerea automată este traducerea - de la scris la scris - în timp ce transcrierea se aplică vorbirii și poate fi oferită în formă scrisă.
De exemplu, Centrul de Traduceri pentru Organismele UE oferă utilizatorilor săi ambele tipuri de servicii pentru a le permite să obțină rapid și ieftin un text care poate fi utilizat fără a fi corect.
Primul distribuitor indian de filme - inițial de VHS -, cu câteva sute de milioane de utilizatori înregistrați, cunoscut pentru filmele sale blockbuster, a avut toate cele 12.000 de produse în catalogul său subtitrat - transcris automat - de serviciul Google pentru a le face disponibile în limba arabă. Această transcriere automată reduce costurile cu 25% și întârzierile cu două zile. De asemenea, duce la erori care necesită corectare atunci când sunt detectate sau identificate.
Procesul de traducere (în sens uman) poate fi împărțit în trei faze succesive:
În termeni computaționali, înțelegerea devine analiză , deverbalizarea devine transfer și reexprimarea devine generație . Aceste etape ale procesului sunt modelate în triunghiul Vauquois. Acest model este util deoarece pentru a merge de la sursă la țintă, există mai multe căi posibile care constituie diferitele abordări luate în considerare până în prezent. Cu cât este mai mare gradul de conceptualizare, cu atât mai scurtă este calea transferului. Există patru posibilități principale:
În prezent, motoarele de traducere se bazează în principal pe reguli sau statistici. Apare așa-numita cale hibridă. Systran , Google Translate , Reverso și Microsoft Translation utilizează abordări hibride.
Condițiile preliminare depind de abordarea preconizată: traducere bazată pe reguli (cuvânt cu cuvânt, transfer, pivot), traducere prin exemplu, traducere statistică.
Traducerea automată bazată pe reguli necesită:
Traducerea prin exemplu și traducerea statistică necesită:
În plus, este posibil să avem nevoie de instrumente de analiză lingvistică precum:
Mai multe abordări pot fi luate în considerare pentru traducerea automată.
Utilizarea traducerii automate a devenit obișnuită pentru anumite schimburi și în anumite cercuri profesionale.
De exemplu, în ciuda riscurilor și în absența unor profesioniști competenți, spitalele și clinicile din Statele Unite ar putea apela la traducerea automată.
90% din textele traduse de Direcția Generală Traduceri (DG TRAD) sunt pre-traduse prin traducere automată.
Traducerea automată, dură, nu este perfectă, iar unele rezultate pot fi găsite în rezultat, cum ar fi utilizarea unui cuvânt în loc de altul. Prin urmare, trebuie refăcut pentru a elimina erorile.
Exemplu de eroare în care cuvântul judecată este tradus prin cuvântul decret:
„ Referindu-se la decretul făcut în acest caz la 31 ianuarie 2019, prin care a fost decretată nunta solemnizată la 1 iulie 2013. ( „ Referindu-se la decretul din acest caz la 31 ianuarie 2019, prin care s-a decretat căsătoria ar fi sărbătorit solemn la 1 iulie 2013 „ în engleză )”
- Traducere juridică versus traducere automată
Când cantitatea și costul au prioritate față de calitate, traducerea automată este privilegiată, iar traducătorul profesionist este obligat să își justifice valoarea adăugată.
Metricele de măsurare a calității sunt utilizate pentru a putea automatiza măsurarea calității traducerii automate. Unele valori cunoscute sunt ALBASTRU , ROȘU, NIST și METEOR.
Traducerea automată poate fi, de asemenea, supusă clasificării umane:
Acest tip de serviciu poate prezenta riscuri în domeniul vieții private, precum și riscuri de inducere a prejudecăților rasiste sau sexiste.
Utilizarea necorespunzătoare poate duce la alte riscuri în funcție de utilizare, astfel încât, potrivit Daily Telegraph, un angajat polonez a fost grav rănit după ce a urmat instrucțiunile de siguranță pe care Google le-a dat o traducere incorectă sau eronată la cererea angajatorului - Nurseries Parker
Cunoașterea utilizării traducerii automate cu retrospectiva necesară se numește „Alfabetizarea traducerii automate”.
Dispozitivele actuale de traducere sunt utile pentru situații limitate, cum ar fi rezervarea unei camere într-un hotel. „Dacă merg la Beijing, pot rămâne la Hilton fără nicio problemă”, a declarat Stephan Vogel, cercetător Carnegie Mellon.
Serviciile online sunt ușor de utilizat în aparență: constau în deschiderea serviciului, copierea automată a textului care urmează să fie tradus, alegerea limbii originale și a limbii de destinație și apoi solicitarea traducerii.
Traducători online gratuiți :
Acestea vă permit să traduceți cuvinte sau texte de dimensiuni limitate. Acesta este de exemplu:
Software gratuit :
Medii de dezvoltare :
Diferite proiecte urmăresc îmbunătățirea performanței și vitezei motoarelor de traducere (inclusiv a celor de la Google ), sperând într-o zi să poată depăși „bariera lingvistică” și să traducă în timp real (așa cum a fost imaginat de mulți autori de știință-ficțiune ) limbă străină sau chiar să poată „comunica” cu anumite animale prin intermediul software-ului de procesare vocală.