Let's Do It Romania - 24 Septembrie 2011



   

Accentul local

   

Ne-am mulţumit cu puţin la masa "glocalizării" informatice şi acum începem să tragem ponoasele.


Mircea Sârbu


Termenul de "glocalizare" -- globalizare combinat cu localizare -- a căpătat popularitate relativ recent, mai cu seamă în contextul paradigmei Web 2.0. Conceptul este însă mai vechi, fiind legat de expansiunea economiei japoneze şi de conflictul dintre practicile occidentale şi tradiţiile societăţii japoneze. Ideea de bază este că globalizarea trebuie armonizată cu elementele culturilor locale şi că elementele globale beneficiază la rândul lor din contactul cu elementele locale. Expresia succintă a glocalizării: gândeşte global, acţionează local.

Înainte de a ajunge la oile noastre informatice mai trebuie spus că "local" nu trebuie înţeles în sens geografic, ci cultural. Şi care este oare expresia cea mai pregnantă a culturii locale dacă nu limba locului? Dacă analizăm puţin situaţia limbii române în contextul globalizării informatice trebuie să admitem că noi am cam întârziat la primele lecţii de glocalizare şi ne-am ales cu lacune serioase. N-o să mai insist asupra întârzierii cu care principalele softuri au fost traduse şi adaptate la caracteristicile locale ci mă voi limita la problema banală a literelor mai "speciale" ale limbii române, cele care se exprimă prin caractere cu diacritice.

Mai întâi a fost o chestiune de atitudine. În vreme ce pentru francezi sau unguri scrierea cu diacriticele specifice a fost asociată cu demnitatea naţională, noi ne-am resemnat şi am aşteptat ca alţii să ne rezolve problemă. Iar acei alţii au rezolvat-o de capul lor. De pildă Microsoft, într-un lăudabil efort de a ne da posibilitatea să scriem româneşte, a conceput pagina de cod CP1250. Numai că, ghinion, literele "ş" şi "ţ" s-au procopsit cu câte-o sedilă dedesubt, în locul virguliţei recomandate de Academia Română (destul de târziu de altfel). Merge şi aşa, cu observaţia că litera t cu sedilă nu există în nicio limbă de pe pământ. Apple a codificat corect caracterele cu diacritice, dar astfel ne-am ales cu două standarde, proprietare şi incompatibile. Odiseea nefericitului binom ş/ţ a continuat şi în standardizările internaţionale (de pildă ISO 8859-2, zis şi Latin2), de la lucrările cărora se pare că românii au cam lipsit. Când ne-am întors din transhumanţă şi am propus standardul Latin10, era prea târziu. Până şi standardul Unicode -- care-şi propune să rezolve toate scrierile pământului, vii sau moarte -- a aflat de virguliţele noastre abia la ediţia a 3-a, aşa că variantele corecte de au fost incluse în subsetul Latin Extended-B. În fine, avem coduri, dar sunt puţine fonturi care să dea corp literelor cu virguliţă. De bine de rău, putem scrie româneşte pe web şi în mesaje e-mail, cu şanse mari ca textul să poată fi vizualizat.

Poate veţi crede că sunt un "păşunist" obsedat de corectitudinea scrierii româneşti. Nu sunt. Problemele mele sunt mult mai practice. Pe computerul cu care lucrez de obicei (un Linux Ubuntu) am posibilitatea să scriu fie cu sedile fie cu virguliţe şi folosesc prima variantă. De ce? Pentru că aşa vrea corectorul meu lexical! Având coduri diferite, caracterele cu sedilă sunt diferite de cele cu virguliţă, şi de aici încep complicaţiile în aplicaţii. Până acum foloseam codificarea Latin2, dar anumite cerinţe locale mi-au impus să adopt o codificare globală (deh, glocalizarea) aşa că acum totul trece în UTF-8 şi problemele continuă. O banală sortare alfabetică devine o problemă. În Python, lungimea unui string nu mai coincide cu numărul de caractere iar conversia la ASCII nu mai funcţionează. Funcţionează în schimb în Postgres, aşa că ajung să apelez baza de date din front-end pentru o simplă conversie. De curând m-am lovit de o altă problemă care mi-a răpit o zi întreagă: Ajax părea să nu lucreze decât cu ASCII, iar asta îmi dărâma întreaga construcţie. A trebuit să caut mult până să constat că funcţia JavaScript care codează string-urile pentru transferul prin reţea lucrează diferit de echivalentele ei Python în cazul caracterelor non-Latin1. Aşa că soluţia a fost să transfer prin reţea textul codat Base64 (care este ASCII pur), urmând ca la sosire funcţiile de procesare să-l decodifice. Nu sunt mândru de aceste hack-uri, dar... clientul aşteaptă.

Concluzia este că ne-am mulţumit cu puţin la masa glocalizării, nu ne-am afirmat la timp specificul local şi acum tragem ponoasele. Problemele informatice sunt doar o exemplificare, însă fiecare dintre noi poate găsi exemple similare în diverse domenii.


 

(Publicat în PC Magazine - aprilie 2008)

 

Copyright © 2008 Agora Media

Creative Commons License
This work is licensed under a Creative Commons License.