Metoda Cangjie

Cangjie Metoda ( simplificată Chineză  :仓颉输入法 ; tradițională chineză  :倉頡輸入法 ; pinyin  : cangjie shūrùfǎ  ; Wade  : -ts'ang¹ chieh² shu¹ru⁴fa³  ; Cantoneză Jyutping  : cong¹ kit³ syu¹jap⁶faat³ ) este un calculator metoda de introducere pentru introducerea sinograms , pe baza compoziției lor grafice și etimologice . Tastele tastaturii reprezintă 24 de „radicali” chinezi; cu toate acestea, descompunerea nu se bazează nici pe tulpinile sau cheile tradiționale ale lui Kangxi , nici pe ordinea standard a trăsăturilor. Este vorba despre o descompunere geometrică. Cele 214 de taste din limba chineză nu sunt reprezentate toate, deci este uneori necesar să împodobim una dintre formele folosite, bazându-ne pe prima lovitură.

Inventat în 1976 de Chu Bong-Foo , își ia numele de la legendarul Cang Jie (2650 î.Hr.), ministru al împăratului despre care se spune că ar fi inventat caracterele chinezești (汉字, hànzì ). Acest nume a fost sugerat de Chiang Wei-kuo , pe atunci ministru al apărării din Taiwan . Deși metoda a fost inițial concepută pentru personaje tradiționale , de atunci a fost reproiectată pentru a include caractere simplificate .

Descompunere

Radicali

Componentele de bază se numesc radicali (字根, zì gēn ) sau litere (字母, zì mǔ ). Sunt 24, dar sunt folosite 26 de taste de tastatură; cei 24 de radicali (formele fundamentale基本 字形, jīběn zìxíng ) sunt asociate cu aproximativ 76 de forme auxiliare (輔助 字形, fǔzhù zìxíng ), care pot fi rotații, părți sau deformări ale formelor fundamentale. De exemplu, forma 日 (A) reprezintă sinograma 日 în sine, dar și 曰, sau o rotație a acesteia cu 90 °.

Tastele folosite pentru a intra în acești radicali sunt împărțite în patru grupuri: blocul sinogramelor filosofice (de la A la G, reprezentând soarele, luna și cele cinci elemente), blocul de linii (de la H la N, reprezentând linii simple) , blocul părților corpului (de la O la R, reprezentând părți ale corpului uman) și blocul de forme (de la S la Y, reprezentând forme complexe prezente în sinograme).

grup Atingere Numele de familie Forme asociate Exemple
Filozofic LA 日 soare Cjrk-a0.pngCjrk-a3.png Cjek-a0-1.pngCjek-a2-1.pngCjek-a3-2.png
B 月 lună Cjrk-b6.pngCjrk-b8.pngCjrk-b11.pngCjrk-b12.pngCjrk-b16.png Cjek-b1-1.pngCjek-b6-2.pngCjek-b9-1.pngCjek-b8-1.pngCjek-b11-5.pngCjek-b13-2.pngCjek-b15-1.png
VS 金 aur Cjrk-c1.pngCjrk-c3.png Cjek-c1-1.pngCjek-c2-2.pngCjek-c2-3.pngCjek-c3-1.pngCjek-c5-2.pngCjek-c6-2.png
D 木 lemn Cjrk-d1.pngCjrk-d2.pngCjrk-d3.pngCjrk-d5.png Cjek-d0-1.pngCjek-d2-1.pngCjek-d3-2.pngCjek-d5-1.pngCjek-d6-4.png
E 水 apă Cjrk-e0.pngCjrk-e2.pngCjrk-e8.pngCjrk-e3.png Cjek-e0-2.pngCjek-e2-1.pngCjek-e7-1.pngCjek-5e-1.pngCjek-e4-3.png
F 火 foc Cjrk-f1.pngCjrk-f2.pngCjrk-f4.pngCjrk-f7.pngCjrk-f8.png Cjek-f0-2.pngCjek-f2-1.pngCjek-f4-2.pngCjek-f5-1.pngCjek-f7-1.pngCjek-f8-1.pngCjek-f8-2.png
G 土 pământ Cjrk-g0.pngCjrk-g2.png Cjek-g0-1.pngCjek-g0-2.pngCjek-g1-1.pngCjek-g2-1.png
Caracteristici H 竹 bambus Cjrk-h1.pngCjrk-h2.pngCjrk-h3.pngCjrk-h6.png Cjek-h1-2.pngCjek-h2-1.pngCjek-h3-1.pngCjek-h3-2.pngCjek-h6-1.png
Eu 戈 armă Cjrk-i0.pngCjrk-i1.pngCjrk-i2.pngCjrk-i3.png Cjek-i0-4.pngCjek-i1-1.pngCjek-i2-1.pngCjek-i3-3.png
J 十 zece Cjrk-j0.pngCjrk-j2.png Cjek-j0-1.pngCjek-j0-3.pngCjek-j2-3.png
K 大 mare Cjrk-k0.pngCjrk-k2.pngCjrk-k4.pngCjrk-k3.png Cjek-k0-1.pngCjek-k2-4.pngCjek-k4-1.pngCjek-k5-1.pngCjek-k3-1.png
L 中 mijloc Cjrk-l0.pngCjrk-l1.pngCjrk-l2.pngCjrk-l3.pngCjrk-l6.png Cjek-l0-4.pngCjek-l1-1.pngCjek-l2-4.pngCjek-l3-1.pngCjek-l6-1.png
M 一 unul Cjrk-m0.pngCjrk-m1.pngCjrk-m2.pngCjrk-m3.pngCjrk-m4.png Cjek-m0-3.pngCjek-m1-2.pngCjek-m2-1.pngCjek-m3-2.pngCjek-m3-3.pngCjek-m3-4.pngCjek-m4-4.png
NU 弓 arc Cjrk-n0.pngCjrk-n1.pngCjrk-n12.pngCjrk-n4.pngCjrk-n8.png Cjek-n0-5.pngCjek-n1-2.pngCjek-n3-1.pngCjek-n11-2.pngCjek-n5-1.pngCjek-n6-1.pngCjek-n7-1.pngCjek-n9-1.png
Anatomie O 人 persoană Cjrk-o0.pngCjrk-o7.pngCjrk-o6.pngCjrk-o8.pngCjrk-o10.pngCjrk-o11.png Cjek-o1-1.pngCjek-o7-1.pngCjek-o6-2.pngCjek-o8-1.pngCjek-o9-2.pngCjek-o11-3.png
P 心 inimă Cjrk-p0.pngCjrk-p1.pngCjrk-p11.pngCjrk-p13.pngCjrk-p15.png Cjek-p0-1.pngCjek-p1-1.pngCjek-p2-1.pngCjek-p6-2.pngCjek-p10-3.pngCjek-p11-1.pngCjek-p13-1.pngCjek-p15-3.pngCjek-p16-2.png
Î 手 mână Cjrk-q0.pngCjrk-q1.pngCjrk-q3.pngCjrk-q8.png Cjek-q0-1.pngCjek-q1-1.pngCjek-q3-1.pngCjek-q5-1.pngCjek-q5-5.pngCjek-q8-1.png
R 口 gură Cjrk-r0.png Cjek-r0-2.pngCjek-r0-4.png
Forme sinograme S 尸 cadavru Cjrk-s0.pngCjrk-s2.pngCjrk-s3.pngCjrk-s5.pngCjrk-s6.pngCjr5k-s1.png Cjek-s0-1.pngCjek-s2-4.pngCjek-s3-1.pngCjek-s5-1.pngCjek-s6-1.pngCjek-s9-1.pngCjek-s10-1.pngCjek-5s-1.pngCjek-5s-4.png
T 廿 douăzeci Cjrk-t0.pngCjrk-t3.pngCjrk-t10.pngCjrk-t12.png Cjek-t0-1.pngCjek-t1-1.pngCjek-t1-5.pngCjek-t3-1.pngCjek-t5-1.pngCjek-t8-1.pngCjek-t9-1.pngCjek-t10-1.pngCjek-t12-1.pngCjek-t12-4.pngCjek-t13-1.png
U 山 munte Cjrk-u0.pngCjrk-u1.pngCjrk-u2.pngCjrk-u5.pngCjrk-u3.png Cjek-u0-1.pngCjek-u1-2.pngCjek-u1-3.pngCjek-u2-2.pngCjek-u5-2.pngCjek-u3-1.png
V 女 femeie Cjrk-v0.pngCjrk-v2.pngCjrk-v3.pngCjrk-v7.pngCjrk-v9.pngCjrk-v10.png Cjek-v0-1.pngCjek-v2-1.pngCjek-v4-1.pngCjek-v5-2.pngCjek-v8-3.pngCjek-v9-1.pngCjek-v10-1.png
W 田 câmp Cjrk-w1.pngCjrk-w2.pngCjrk-w3.png Cjek-w1-1.pngCjek-w2-1.pngCjek-w2-3.pngCjek-w2-3.pngCjek-w3-1.png
Da 卜 ghicire Cjrk-y1.pngCjrk-y2.pngCjrk-y6.pngCjrk-y8.png Cjek-y0-1.pngCjek-y3-1.pngCjek-y4-1.pngCjek-y6-1.pngCjek-y7-1.png

Tasta X (重 / 難, conflict / dificil) rezolvă ambiguitățile atunci când două coduri rezultate dintr-o descompunere intră în conflict și constituie, de asemenea, un cod al părților greu de descompus. Tasta Z (caractere speciale) este un cod auxiliar folosit pentru a introduce caractere speciale, nu are o semnificație adecvată. Această cheie este combinată cu altele pentru a introduce punctuația chineză (cum ar fi。,。, 「」, 『』).

Unele variante folosesc Z ca cheie pentru a face față conflictelor în loc de X. Cheia Z este apoi numită „conflict (重)” în timp ce tasta X este numită „dificil (難)”; dar utilizarea cheii Z ca cheie de conflict nu este prezentă în metoda originală și nici în implementările actuale. În alte variante, tasta Z este „definită de utilizator” (造).

Formele auxiliare ale fiecărei tulpini au variat ușor între diferitele versiuni ale metodei; acesta este motivul pentru care diferitele versiuni nu sunt pe deplin compatibile.

Reguli de baza

Dactilograful ar trebui să se familiarizeze cu mai multe reguli de descompunere (拆字 規則) care definesc modul de procesare a unei sinograme până când se termină cu un cod cangjie .

Regulile sunt supuse mai multor principii:

Exemple de utilizare

Dificultăți

Metoda cangjie a fost concepută pentru a fi un sistem ușor de utilizat pentru a promova utilizarea chinezei în informatică; cu toate acestea, multor utilizatori le este greu.

Cu toate acestea, cu o practică suficientă, un utilizator cu experiență ar putea atinge o viteză de tastare de la 60 la 200 de sinograme pe minut.

Există totuși probleme intrinseci cu metoda:

Metoda cangjie necesită utilizarea a 26 de taste pe o tastatură. Prin urmare, nu poate fi utilizat pe telefoane cu tastatură cu 9 taste. În acest caz, metoda zhuyin , metoda în 5 timpi (sau metoda Motorola în 9 timpi ) și metoda de intrare Q9 sunt standard, deoarece au fost concepute special pentru utilizarea pe tastaturile telefonului. Evident, smartphone-urile îl pot utiliza prin intermediul tastaturii lor virtuale pe un ecran tactil.

Istorie

Sistemul inițial de cangjie

Inițial, metoda de introducere cangjie nu a fost concepută pentru a introduce sinograme din tabelele de caractere codate . În schimb, a fost un sistem integrat care include reguli de intrare și un card de control. Acesta din urmă conținea un firmware care permite generarea codurilor de pe ecran, prin modul grafic de înaltă rezoluție al computerelor Apple II . În prefața manualului de utilizare, Chu Bong-Foo scria în 1982:

„În ceea ce privește redarea: redarea și introducerea [formează] un întreg integrat; nu există niciun motiv pentru care [ar trebui să fie] separați dogmatic în două dispozitive distincte ... "

- Chu Bong-Foo, tradus din manualul de utilizare a metodei Cangjie

În această versiune inițială, când utilizatorul introduce „yk” pentru a obține, sinograma nu este codificată; șirul „yk” este stocat. Într-un fel, codul cangjie (un șir de unu până la cinci caractere urmat de un spațiu) constituie codificarea acestuia.

O caracteristică a acestui sistem original este că, dacă se încearcă introducerea unei secvențe aleatorii de litere, generatorul de sinograme va încerca să le creeze conform regulilor de descompunere, uneori creând sinograme inexistente. Această capacitate neobișnuită este descrisă în manual și are ca rezultat peste 10.000 de caractere din cele 15.000 de caractere pe care sistemul le poate gestiona. Numele cangjie , evocând crearea de noi sinograme, era atunci deosebit de adecvat.

Prezența acestui generator integrat explică, de asemenea, necesitatea de a avea o cheie X pentru a elimina ambiguitățile descompunerilor pe care versiunile ulterioare le-au moștenit: deoarece sinogramele sunt determinate pe afișaj, fiecare trebuie să aibă o descompunere unică. Nu ar avea sens să lăsăm la latitudinea cititorului să determine sinograma corectă dintr-o listă de candidați.

Versiuni

Metoda de introducere cangjie a trecut prin cinci versiuni. În prezent, versiunea 3 (第三 代 倉 頡) este cea mai comună; aceasta este versiunea acceptată nativ de Microsoft Windows . Versiunea 5 (第五 代 倉 頡) acceptată de Free Cangjie, iOS și SCIM IME este o minoritate.

Versiunea 1 nu a fost lansată niciodată. Versiunea 2 a fost acceptată de cardul Apple II Zero One . Metoda acceptată de Mac OS a fost apropiată de versiunile 3 și 5. Versiunea 5 a fost creată de Chu Bong-Foo însuși. Chu Bong-Foo spera că lansarea versiunii 5, numită inițial versiunea 6, va pune capăt proliferării versiunilor (oferite de revânzători). Versiunea 6 a fost dezvoltată de Shen Honglian (沈 紅蓮), asistent al lui Chu Bong-Foo. Permite codificarea a aproximativ 100.000 de caractere atestate în literatura chineză. Aceste tabele de caractere au fost dezvoltate independent de Unicode , pe care Chu Bong-Foo l-a criticat ca fiind inferior în design . Versiunea 6 nu a fost încă lansată, dar este deja utilizată pentru stocarea digitală a textelor chinezești istorice.

Un exemplu al diferenței dintre aceste versiuni este introducerea sinogramelor 面 și 非:

Introducerea sinogramelor 面 și
Versiunea 3 (三代) Versiunea 5 (五代) Versiunea 6 (六 代)

MWYL

MWSL MWS

LMYYY

LMSY LSY

Caracteristici suplimentare

Majoritatea implementărilor moderne ale metodelor de intrare cangjie oferă funcționalități suplimentare:

Multe dintre aceste caracteristici, în special metacaracterele, sunt la îndemână pentru utilizatorii obișnuiți, dar nu sunt potrivite pentru dactilografi deoarece fac metoda imprevizibilă.

Au existat multe încercări de simplificare a metodei cangjie  :

Aplicații

Mulți cercetători au examinat diferitele modalități de descompunere a sinogramelor în componente și au încercat să creeze aplicații pe baza sistemului lor de descompunere. Conceptul este uneori denumit 漢字 基因, literalmente „Studiul genelor sinogramei”. Codurile cangjie oferă o bază pentru o astfel de inițiativă. Academia Sinica din Taiwan și -Jiao Tong University din Shanghai sunt în curs de dezvoltare proiecte similare.

Una dintre aplicațiile directe ale utilizării descompunerilor sinogramei este posibilitatea studierii asemănărilor; metoda de introducere cangjie oferă un punct de plecare pentru astfel de aplicații. Prin adoptarea unor coduri cangjie detaliate de peste cinci litere, este posibil să se studieze asemănările grafice. Prin integrarea informațiilor despre pronunție cu aceasta, permite studierea sinogramelor asistată de computer.

Anexe

Articole similare

Note și referințe

  1. (zh) 倉 頡 中文 資訊 碼: 倉 頡 字母 、 部首 、 注音 三 用 檢 字 對照, 全 華 科技,1990, manualul versiunii inițiale a sistemului Cangjie cu o placă de control. În secțiunea numită倉 頡 字母 中文 輸入 法 : „Există și forme auxiliare pentru a depăși neajunsurile radicalilor. Aceste forme sunt variații ale formelor radicale, [și așa] sunt ușor de reținut. […] Dicționarul atașat [la această lucrare] se bazează [ sic ] pe cele 4.800 de caractere standard utilizate în mod obișnuit și inventariate de Ministerul Educației. Adăugându-le celor care sunt generate automat, numărul de caractere este de aproximativ 15.000 (folosind dicționarul Kangxi ca bază). "
  2. (zh) Array.com.tw evocă lipsa marjei de eroare lăsată de metoda Cangjie.
  3. http://cdp.sinica.edu.tw/cdphanzi/漢字 構 形 資料 庫
  4. 上海 交通 大學 漢字 編碼 組, 上海 漢語拼音 文字 研究 組 編著。 漢字 信息 字典。 北京市 科學 出版社 , 1988。
  5. 宋 柔 , 林 民 , 葛 詩 利。 漢字 字形 計算 及其 在 校對 系統 的 的 應用 , 小型 微型 計算機 系統 , 第 29 卷 第 10 期 , 第 1964 至 1968 頁 , 2008。
  6. Chao-Lin Liu , Min-Hua Lai , Kan-Wen Tien , Yi-Hsuan Chuang , Shih-Hung Wu și Chia-Ying Lee , "  Caracterele similare vizual și fonologic în cuvinte chineze incorecte: analize, identificare și aplicații  ", ACM Transactions on Asian Language Information Processing , vol.  10, n o  22011, p.  1–39 ( DOI  10.1145 / 1967293.1967297 )

linkuri externe